This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] TDA4VM:边缘 AI:DepthSpace 运算符在 fp32上无法正常工作

Guru**** 1821780 points
Other Parts Discussed in Thread: TDA4VM
请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1381187/tda4vm-edge-ai-depthspace-operator-not-functioning-correctly-on-fp32

器件型号:TDA4VM

工具与软件:

嗨 champs、  

设置:

Edgeai SDK:09_02_07_00

AM68PA/J721E (TDA4VM)

我正在使用上述设置运行自定义模型,模型正在使用"-d"或卸载模式,但在"-c"模式下失败,并发现深度空间运算符正在创建问题,因此将其放在拒绝列表中,该列表给出以下错误 e2e.ti.com/.../log_5F00_blck_5F00_default_5F00_fp32_5F00_c.txte2e.ti.com/.../Blockage_5F00_FNC_5F00_FWC_5F00_model-artifacts.zipe2e.ti.com/.../blockage_5F00_v1.zip

我分享了日志,模型工件和模型

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好!

    由于带宽受限而导致我们重新使用系统、我们深表歉意。

    我们有 SDK 9.2.0.9版本(有显著改进)、您可以在最新工具上试用模型编译 exp 并告诉我们这里的观察结果吗?

    我建议几个除外

    1.尝试在没有任何拒绝列表的情况下导入模型,让允许列表处理支持的层其余将委托给 ARM(确保传递正确的输入,如果您有浮点作为输入节点,并且您正在执行量化,请确保在图形的开头和结尾适当地添加 DATA_CONVERT_Ops )

    2.尝试添加特定的图层添加到拒绝列表(如上所述的深度空间运算符等)

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    我在 SDK 9.2.9中遇到类似的错误,而不 使用拒绝列表中的运算符,但得到相同的特定错误  

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    谢谢你的观察,让我尝试验证相同的在我,并回到你。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    感谢您的实验、请检查它的 INT8 张量位、编译和推理 下面是我得到的内容的屏幕截图  

      

    是的、两个模型是相同的  

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Abhilash:

    参考您的上述回答、  

    我在 SDK 9.2.9中得到类似错误、而不 使用拒绝列表中的运算符、但得到相同的特定错误 

    我们建议使用最新工具尝试相同的实验、并且从您这边观察到的 SEG 故障问题与以前相同。

    会不会想在9.2.9.0上的 tensor_bits = 32的模型编译上抛出一些光,你能验证你上面提到的问题在其中得到解决吗?

    其次、您可以澄清此处提到的当前问题、

    请检查 int8 张量位的编译和推理 下面是我得到的内容的屏幕截图 [/报价]

    您能详细说明您在这里面临的问题吗? 您是否可以使用编译日志支持此功能? 等等

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Abhilash:

    我随附供您参考的观察表、其中包含观察列表、请告知我们您这边是相同的。

    在此处为 TI 内部跟踪目的添加 JIRA 链接: jira.itg.ti.com/.../TIDL-4446

    请确认相同并共享补丁。

    谢谢  

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、正如在呼叫中讨论和解释的、PFA 在 c7x 的相应文件中进行了更改  

    1.更改#1: 在 tidl_import_common.cpp 文件中、以下函数 TIDL_tfOutReshapeConvLayer ()

    e2e.ti.com/.../5808.tidl_5F00_import_5F00_common.cpp

    2.更改#2 : 在 tidl_commonUtils.c 文件中修改了以下 tidl_writeTraceDataBuf()   

    e2e.ti.com/.../tidl_5F00_commonUtils.c

    问题#1:在目标上、如果启用了"Debug_level:3 "标志、则会出现分段故障或挂起

    问题2:在目标上、如果禁用标志、则输出不正确[viz op]

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Abhilash:

    我已在星期五(7月19日)发布我们的电话后更新了对 JIRA 的观察。

    是否有可能获取 delta (补丁文件)以便根据我们之前的一致性了解突出显示的变化。

    谢谢你

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Pratik、您好!  

    由于 c7x 封装很重,它不在我的本地 git 中,所以创建补丁很困难,我共享下面的文件作为 txt 格式,以便你可以相应地查看它  

    1.更改#1: 在 tidl_import_common.cpp 文件中、以下函数 TIDL_tfOutReshapeConvLayer ()

    e2e.ti.com/.../tidl_5F00_import_5F00_common.cpp.txt

    2.更改#2 : 在 tidl_commonUtils.c 文件中修改了以下 tidl_writeTraceDataBuf()   

    e2e.ti.com/.../tidl_5F00_commonUtils.c.txt

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Abhilash:

    感谢您共享文件、似乎在这些文件中添加了大量更改。

    由于 c7x 封装很重、而且不在我的本地 Git 中、因此创建补丁很困难、

    我理解此问题、如上所示、您仅测试了2个文件的功能更改、因此让我们粘附2个文件来创建补丁。

    让我来帮助您如何使用 git diff 创建补丁。

    1)将 git repo 初始化到 c7x-mma-tidl 文件夹中,该文件夹具有上述文件(9.2.5.0基线)

    2) 2)在上述文件中添加相关更改

    3)  

    git diff tag1..tag2 > mypatch.patch

    4)在共享之前、请确保正确应用补丁及其功能。

    这将帮助我查看您添加的相关更改。

    谢谢你

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好 Pratik ,  

    很抱歉延迟,压倒性的更改是由于在我的 IDE 中启用了自动缩进,所以我在此软件包中共享所需的更改  

    e2e.ti.com/.../2577.tidl_5F00_commonUtils.c.txte2e.ti.com/.../2577.tidl_5F00_import_5F00_common.cpp.txt

    感谢您提供有关补丁创建的建议  

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Abhilash:

    感谢共享代码文件,您建议我们使用9.2.0.5基准 SDK 手动比较上述共享文件吗? 我在这里的理解是否正确?

    共享补丁是软件行业中非常常见的做法、可以共享代码更改、也可以通过读取补丁文件来查看增量。 如果您在创建补丁文件时需要我的帮助、请在此处告诉我。 我相信我们已经在调试呼叫期间支持这一点。

    再次感谢您的理解。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Pratik、您好  

     e2e.ti.com/.../psdk_5F00_9.2_5F00_DepthToSpace_5F00_fix.patch.txt 中共享的 PFA 补丁文件

    通过删除".txt"重命名文件 ,如果你需要任何其他东西,请让我 kwn。   在 PSDK 改变深度以在 目标上显示空间的情况下运行这一模型时、我有一些后续问题。

    1.目标上用于推理的数据流是否不同于 x86

    2.是否有针对目标的不同运算符的优化 DSP 实现,是在哪里可以找到这些实现  

    3.除了调试级别和跟踪标志之外、是否有更好的方法在目标上进行调试?

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Pratik、您好  

    在 edgeAI- x86上,我们能够调试和修复"TIDL_conv2dRefProcess "。 与 DepthToSpace 相关的早期帖子中提供了修复。  

    现在、当我们在目标 TDA4VM 上运行相同的时、我们不会得到预期的结果、结果表明"Target 针对此过程具有不同的优化流程、即 DepthToSpace"、我们的修复程序将不会对目标执行任何更改。  

    在 Target 上、正在执行函数"TIDL_conv2dDspProcesses"、该函数是" tidl_obj_algo.lib"。 我们没有对此库的源代码访问权限来执行我们之前所做的类似修复。  

     

    因此、请建议如何处理此问题、因为它目前对我们来说是阻碍因素。 另请告知我们哪种解决方案最适用:  

    1 -是否可以与 NDA 共享源代码  

    2 - TI 将解决此问题并与我们分享 tidl_obj_algo.lib

     

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Abhilash、

    我正在内部讨论上述几点、我们将回复您。

    谢谢你

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    在解锁的螺纹上测试开机自检。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    此错误将作为计划于2024年10月15日发布的补丁的一部分予以修复。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    感谢更新克里斯,下面我正在分享模型工件和堵塞模型的日志与 e2e.ti.com/.../blockagev1_5F00_10.0.06.zip 编译 和推理在 edgeai 10.00.06

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Chris、您好!  

    共享增补程序时是否有任何更新? 演示即将结束、我们热切期待此补丁请求您尽早分享  

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Abhilash:

    出现了一点延迟。  我收到了开发团队的最新消息、该版本将在明天准备就绪。

    此致、

    Chris

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    补丁发布的 CDDS 链接今天传递给 Bob A.。   

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Chris、您好!  

    感谢分享补丁,我们能够整合 DepthtoSpace 从 10_00_08_00 c7x 到 09_02_00_05 c7x 的更改,现在我们能够运行 blocking_v1.onnx 模型在主机上与 int8的 tensorities 运行,但在目标上运行时得到错误的结果。  

    1.我可以共享 09_02_00_05 c7x 的补丁以供审核、以便您最终验证所做的更改  

    2.我已经附上了通过更改生成的 modelartimcats ,你可以查看它,并指出为什么不能在目标 e2e.ti.com/.../Blockage_5F00_FNC_5F00_FWC.zip 上获得预期结果

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Abhliash:

    我已复制了您上一篇帖子中的人工文档、但您能否为此打开新主题?    来自该线程的原始堵塞正在工作,现在你正在研究优化结果。  此外、该线程 已超过4个月、可能会在随机播放中丢失。   

    这句话是什么意思?   

    我能否将 09_02_00_05 c7x 的补丁分享给大家以供审核、以便您最终验证所做的更改  

    它在 zip 文件中吗? 如果没有、请将您的更改发送给我。

    谢谢!

    Chris

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    当然、我将打开此帖子的新主题  

    我的补丁、其中我将其从 10_00_08_00 c7x 改为 09_02_00_05 c7x。 是否要将其作为 zip 文件???

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    请。  谢谢。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    感谢您的回复、请填写新主题 e2e.ti.com/.../tda4vm-tda4vm-edge-ai-depthspace-operator-not-functioning-correctly-on-the-target-board-tda4evm 的 e2e TT