ID do artigo: 000057525 Tipo de conteúdo: Manutenção e desempenho Última revisão: 31/01/2023

Por que o tempo de carga do modelo para a GPU é mais longo do que para a CPU?

Ambiente

OpenVINO™ de ferramentas Plugin da GPU Plugin da CPU

BUILT IN - ARTICLE INTRO SECOND COMPONENT
Resumo

Passo rápido para melhorar o tempo de carga do modelo na GPU

Descrição

Carregar uma representação intermediária (IR) de um modelo de entrada para GPU leva mais tempo do que carregar o mesmo modelo para uma CPU.

Resolução

Crie manualmente cl_cache diretório no diretório de trabalho da sua aplicação.

O driver usará este diretório para armazenar as representações binárias dos kernels compilados. Isso funcionará em todas as OSes suportadas.

Outras informações

Consulte este artigo para obter mais informações sobre como gerenciar o cl_cache.

Carregar seu modelo de entrada em formato de Representação Intermediária (IR) para GPU leva mais tempo do que carregar o mesmo modelo para uma CPU porque a pilha da GPU é baseada no OpenCL*. O tempo de carga depende do tempo de compilação dos kernels OpenCL*.

Quando você habilitar o cl_cache, a primeira vez que carregar o modelo, ele ainda levará muito tempo porque o kernel OpenCL* será compilado. No entanto, cada carga subsequente do mesmo modelo será muito mais rápida.

Produtos relacionados

Este artigo aplica-se a 2 produtos

O conteúdo desta página é uma combinação de tradução humana e por computador do conteúdo original em inglês. Este conteúdo é fornecido para sua conveniência e apenas para informação geral, e não deve ser considerado completo ou exato. Se houver alguma contradição entre a versão em inglês desta página e a tradução, a versão em inglês prevalecerá e será a determinante. Exibir a versão em inglês desta página.