Por que o formato do modelo quantizado permaneceu FP32 em vez de INT8?
Tipo de conteúdo: Documentação e informações do produto | ID do artigo: 000095064 | Última revisão: 13/06/2023
Durante a quantização, apenas as operações necessárias em perspectiva de desempenho estavam sendo quantificadas. As operações restantes permanecerão como FP32 na saída.
Consulte a OpenVINO™ de baixa precisão.