Ir para o conteúdo principal
Base de conhecimentos do Suporte

Desempenho de inferência mais lento em Stick de computação neural Intel® 2 (Intel® NCS2) em comparação com a CPU

Tipo de conteúdo: Manutenção e desempenho   |   ID do artigo: 000089522   |   Última revisão: 20/11/2023

Descrição

  • Processador Intel® Core™ i7 usado para executar o benchmark_app.py com -m model.xml, com entrada aleatória gerada
  • O desempenho no NCS2 é mais lento do que a CPU:

    Para o NCS2:
    [ INFO ] First inference took 33.88 ms
    [Step 11/11] Dumping statistics report
    Count: 2596 iterations
    Duration: 60141.63 ms
    Latency: 92.60 ms
    Throughput: 5525.09 FPS

    Para CPU:
    [ INFO ] First inference took 17.07 ms
    [Step 11/11] Dumping statistics report
    Count: 148124 iterations
    Duration: 60001.79 ms
    Latency: 1.61 ms
    Throughput: 315988.43 FPS

Resolução

Espera-se que o desempenho da CPU seja melhor em comparação com Intel® NCS2 uma vez que a CPU tem mais potência de computação.

Intel® NCS2 é um dispositivo acelerador que ajudaria em certas situações, especialmente quando é necessária energia adicional de computação.

Além disso, a CPU requer o formato do modelo FP32, enquanto Intel® NCS2 requer o formato do modelo FP16. O FP16 pode ter um erro de quantização, pois é espremido de um modelo de precisão total para torná-lo menor. Isso afetaria a precisão e o desempenho.

Desempenho significa a velocidade com que o modelo está em implantação com duas métricas principais: latência e taxa de transferência.

No OpenVINO™, há duas abordagens para melhorar o desempenho:

Durante o desenvolvimento: ferramenta de otimização pós-treinamento (POT), estrutura de compressão de rede neural (NNCF), otimizador de modelo.

Durante a implantação: ajustando parâmetros de inferência e otimizando a execução do modelo.

é possível combinar as duas abordagens.

Produtos relacionados

Este artigo aplica-se a 4 produtos.
Software do processador Intel® Xeon Phi™ OpenVINO™ toolkit Bibliotecas de desempenho

Produtos descontinuados

Intel® DevCloud for the Edge

Avisos legais

O conteúdo desta página é uma combinação de tradução humana e por computador do conteúdo original em inglês. Este conteúdo é fornecido para sua conveniência e apenas para informação geral, e não deve ser considerado completo ou exato. Se houver alguma contradição entre a versão em inglês desta página e a tradução, a versão em inglês prevalecerá e será a determinante. Exibir a versão em inglês desta página.