Não foi possível determinar como converter os modelos Detectron2* e Layout-LM* para OpenVINO™ representação intermediária (IR) e inferir com plugin da CPU.
Para converter o modelo Detectron2 , siga o tutorial do Colab para treinar e inferir o modelo Detectron2* com PyTorch* e também siga as etapas descritas abaixo para converter o modelo para o formato ONNX* e depois para o formato IR.
$ python export_model.py --config-file ./output.yaml --sample-image ./new.jpg --output ./model/ --rastreamento do método de exportação --formato onnx MODEL. PESOS ./output/model_final.pth MODEL. CPU DEVICE
print(cfg.dump())
com open("output.yaml", "w") como f:
f.write(cfg.dump())
$ pip instalar openvino-dev
$ mo -input_model ./model/model.onnx
Com o modelo ONNX*:
Taxa de transferência benchmark_app -m model.onnx -d CPU -niter 100 -api async -hint
Latência de assíncrona de $ benchmark_app -m model.onnx -d CPU -niter 100 -api async
Com modelo de IR:
Taxa benchmark_app -m model.xml -d CPU -niter 100 -api async -hint throughput
Latência de assíncrona de $ benchmark_app -m model.xml -d CPU -niter 100 -api async
Para converter o modelo layout-LM. Siga as etapas descritas abaixo para converter o modelo layout-LM e a inferência com OpenVINO™.
Transformadores de instalação de $pip[onnx]
$ python3 -m transformers.onnx --model=microsoft/layoutlm-base-uncased onnx
$ pip instalar openvino-dev
$ mo -input_model ./onnx/model.onnx
Com o modelo ONNX*:
$ benchmark_app -m onnx/model.onnx -d CPU -niter 100 -api async -hint throughput -data_shape input_ids[1,1],bbox[1,1,4],attention_mask[1,1],token_type_ids[1,1]
Latência de assíncrona de $ benchmark_app -m onnx/model.onnx -d CPU -niter 100 -api async -hint latência -data_shape input_ids[1,1],bbox[1,1,4],attention_mask[1,1],token_type_ids[1,1]
Com modelo de IR:
Taxa de transferência benchmark_app -m model.xml -d CPU -niter 100 -api async -hint -data_shape input_ids[1,1],bbox[1,1,4],attention_mask[1,1],token_type_ids[1,1]
Latência de assíncrona de $ benchmark_app -m model.xml -d CPU -niter 100 -api async -hint -data_shape input_ids[1,1],bbox[1,1,4],attention_mask[1,1],token_type_ids[1,1]
| Nota |
As formas de entrada (definidas por -data_shape em comandos acima) podem diferir com base no caso de uso. |