Ir para o conteúdo principal
Base de conhecimentos do Suporte

Por que a latência e a taxa de transferência são mais altas quando o modelo de inferência com OpenVINO™ benchmark na GPU em comparação com a CPU?

Tipo de conteúdo: Documentação e informações do produto   |   ID do artigo: 000093152   |   Última revisão: 09/02/2023

Descrição

  • Mesmo modelo inferido com OpenVINO™ benchmark em CPU e GPU:
    benchmark_app.exe -m model.xml -d CPU
    benchmark_app.exe -m model.xml -d CPU
  • A latência e a taxa de transferência resultam em GPU são mais altas do que na CPU.
  • Não é possível determinar por que tanto a latência quanto a taxa de inferência na GPU são superiores à CPU, uma vez que os resultados de baixa latência são de alta taxa de transferência.

Resolução

A latência mede o tempo de inferência necessário para processar uma única entrada se inferir de forma síncrona.

Ao executar OpenVINO™ Benchmark com parâmetros padrão, ele está inferindo no modo assíncrono. Portanto, a latência resultado mede o tempo total de inferência necessário para processar o número de solicitações de inferência.

Além disso, ao executar o Aplicativo benchmark na CPU com parâmetros padrão, são criadas 4 solicitações de inferência, enquanto 16 solicitações de inferência são criadas ao executar o Aplicativo benchmark na GPU com parâmetros padrão. Assim, a latência de inferência na GPU é maior do que na CPU.

Especifique o mesmo número de solicitações de inferência ao executar o aplicativo benchmark na CPU e na GPU para uma comparação justa:
benchmark_app.exe -m model.xml -d CPU -nireq 4
benchmark_app.exe -m model.xml -d CPU -nireq 4

Produtos relacionados

Este artigo aplica-se a 3 produtos.
Software do processador Intel® Xeon Phi™ OpenVINO™ toolkit Bibliotecas de desempenho

Avisos legais

O conteúdo desta página é uma combinação de tradução humana e por computador do conteúdo original em inglês. Este conteúdo é fornecido para sua conveniência e apenas para informação geral, e não deve ser considerado completo ou exato. Se houver alguma contradição entre a versão em inglês desta página e a tradução, a versão em inglês prevalecerá e será a determinante. Exibir a versão em inglês desta página.