工具/软件:
在 SDK 9.2中测试 InnerProduct 层时、我们发现该层的计算时间显著增加至7.5ms。 但 SDK 8.6中的计算时间仅为0.5ms。
我们使用的 SDK 版本为 SDK 9.2、ti_dl 版本为 10.1
我们希望这一问题能够尽快得到解决
This thread has been locked.
If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.
工具/软件:
在 SDK 9.2中测试 InnerProduct 层时、我们发现该层的计算时间显著增加至7.5ms。 但 SDK 8.6中的计算时间仅为0.5ms。
我们使用的 SDK 版本为 SDK 9.2、ti_dl 版本为 10.1
我们希望这一问题能够尽快得到解决
e2e.ti.com/.../InnerProduct_5F00_model.zip
这是我们的测试模型、其中包括 InnerProduct Layer
此处提供了详细日志。
您好:Guang、
这是咖啡模型。 对于此示例模型、我们可以转换为 ONNX、但想检查您在将完整 Caffe 模型转换为 ONNX 时是否有任何问题? 有一些离线工具可用于此类转换。
对此问题进行快速更新
我们在某些特定尺寸的内部产品(即使在8.6 版中)中存在一些不稳定问题(如下所述)、因此后续版本使用 通用的非最佳代码会导致性能不佳
IN > 2048 || OUT > 1024 || OUT < 16U
对于您的情况、它如下所示并达到该条件
输入:4800、输出:64
但内产品可以转换成无菌,然后它应该提供更好的性能
如果你能够使用 ONNX 模型,那么我们可以提供简单的手术规则 ,将内产品(在 ONNX 中的宝石)转换为 matmul。
谢谢、
此致、
Pramod
是的、我们在9.2中发现了稳定性问题、并对其进行了更改、因此任何从9.2 (包括9.2)开始的版本、您都应该看到性能较低。
您能否确认将 您的模型转换为 ONNX 而不是咖啡的可能性? 您可以使用 caffe2onnx·PyPI 等工具
将内部产品(ONNX 中的 gem)转换为 matmul。
如何执行此操作?
尊敬的 Guang:
请查看 onnx 模型优化器 、了解如何将 gem 转换为 ONNX 的 matmul。 我个人不知道如何直接从咖啡转换,但也许开发团队可以很快提供更多的背景。
请务必记住这一点
2025年3月26日(星期三)分享了以下补丁、以解决内部产品性能问题。
链接:tidrive.ext.ti.com/.../7e46c098-8c53-4eb0-84c3-be47c8f34b04
访问代码:|wH7N3VZ
发布您提到的关于一致性问题、并提到将共享一个模型来突出问题、 您能否提供 修剪模型?
如 Christina 所述、我们于2025年3月31日星期一在印度度假 、但鉴于问题的紧迫性、我们仍将努力为这一问题找到解决办法。 因此、请将相关详细信息分享 给我们、以便我们能够取得进一步的进展
谢谢、
Pramod
您好、 Pramod
我们在包含 修剪模型的另一个 TT 中提出了这个一致性问题。 请参阅它。
谢谢、
您好、Pramod
我们仍然重复了基于新补丁的时间消耗急剧增加的问题。 请帮助我们解决问题。
我们使用的补丁是:
链接:tidrive.ext.ti.com/.../7e46c098-8c53-4eb0-84c3-be47c8f34b04
访问代码:|wH7N3VZ
时间消耗急剧增加的现象如下: