主题中讨论的其他器件:TDA4VH
工具与软件:
您好!
关于时间消耗、我目前正在尝试评估是否可以在您的 TDA4VH 卡上运行模型。 要做到这一点,我将使用您的onnxruntime.InferenceSession.get_TI_benchmark_data() 功能,如中所示edgeai-tidl-tools/examples/osrt_python/ort/onnxrt_ep.py。 这将返回包含一些计时数据的字典、包括两个字段ts:run_start和ts:run_end。 这两点包络了推理的哪些部分?
通过查看其他数据字段、我可以看到从进入第一个子图到退出最后一个子图之间大约经过了 xms。 但是、ts:run_start和之间ts:run_end存在大约5xms 的差异。 xms 是可接受的推理时间、而5xms 不是。 您能帮助我理解额外的4倍毫秒源于何处吗? 这些原因是由于推理的设置和清理吗? 如果是、是否可以通过使用 IOBinding 来缓解该问题? 然后、我如何让它与 TIDL 配合使用?
此致
奥洛夫