This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] TDA4VH-Q1:当卷积层设置为 16 位时、当运行到该卷积层时、电路板端演示将崩溃

Guru**** 2538930 points


请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1539048/tda4vh-q1-when-the-convolutional-layer-is-set-to-16-bit-the-board-end-demo-will-crash-when-running-to-this-convolutional-layer

器件型号:TDA4VH-Q1
主题中讨论的其他器件:AM69A

工具/软件:

您好:

我们使用 tidl 模型导入工具、发现当卷积层设置为 16 位时、电路板端演示将在运行到该卷积层时崩溃。

我们测试并发现只有带网格样本层的卷积层才会导致此问题。

所有数据都在压缩包中。

e2e.ti.com/.../0711_5F00_simple_5F00_demo2.zip

 此致、

Hongyao

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    还有一点:我们在 TIDL 模型导入工具的 11.08 版上对其进行了测试。

     此致、

    Hongyao

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    在此处上传我生成的 bin 文件。

    e2e.ti.com/.../tidl_5F00_io_5F00_1.bin

    e2e.ti.com/.../tidl_5F00_net.bin

    此致、

    Adam

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    e2e.ti.com/.../8535.artifacts.tar.gz

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Adam:

    感谢您的确认。  

    此致、

    Hongyao

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你(们)好

    虽然我想您已经知道、我们已经为此问题提交了一个 Jira 项目-> TIDL 7924。 只需将其发布在此处以实现可追溯性。  

    此致、

    Christina

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Hongyao:

    我已经验证新的 PROCESSOR-SDK-RTOS 版本 11.1 https://www.ti.com/tool/download/SDK-J784S4 已经解决了此混合精度问题。

    请尝试。

    EVM 上的推测日志:

    root@j784s4-evm:/opt/tidl_7924# /opt/tidl_test/TI_DEVICE_armv8_test_dl_algo_host_rt.out s:tidl_infer.txt 
    
    Processing config file #0 : tidl_infer.txt 
    Input : dataId=0, name=/bev_encoder/Reshape_15_output_0, elementType 6, scale=1.000000, zero point=0, layout=0
    Input : dataId=1, name=/bev_encoder/Unsqueeze_5_output_0, elementType 6, scale=1.000000, zero point=0, layout=0
    Ouput : dataId=9, name=/bev_encoder/con_layer.0/con_layer.0.0/layer/layer.0/Conv_output_0, elementType 6, scale=1.000000, zero point=0,  
     worstCaseDelay for Pre-emption is 11.8746929 
    APP: Init ... !!!
       120.738443 s: MEM: Init ... !!!
       120.738485 s: MEM: Initialized DMA HEAP (fd=5) !!!
       120.738637 s: MEM: Init ... Done !!!
       120.738652 s: IPC: Init ... !!!
       120.767642 s: IPC: Init ... Done !!!
    REMOTE_SERVICE: Init ... !!!
    REMOTE_SERVICE: Init ... Done !!!
       120.776760 s: GTC Frequency = 200 MHz
    APP: Init ... Done !!!
       120.778680 s:  VX_ZONE_INFO: Globally Enabled VX_ZONE_ERROR
       120.778696 s:  VX_ZONE_INFO: Globally Enabled VX_ZONE_WARNING
       120.778704 s:  VX_ZONE_INFO: Globally Enabled VX_ZONE_INFO
       120.781813 s:  VX_ZONE_INFO: [tivxPlatformCreateTargetId:169] Added target MPU-0 
       120.781930 s:  VX_ZONE_INFO: [tivxPlatformCreateTargetId:169] Added target MPU-1 
       120.782012 s:  VX_ZONE_INFO: [tivxPlatformCreateTargetId:169] Added target MPU-2 
       120.782098 s:  VX_ZONE_INFO: [tivxPlatformCreateTargetId:169] Added target MPU-3 
       120.782110 s:  VX_ZONE_INFO: [tivxInitLocal:202] Initialization Done !!!
       120.782120 s:  VX_ZONE_INFO: Globally Disabled VX_ZONE_INFO
    
    # NETWORK_INIT_TIME =    78.83 (in ms, c7x @1GHz)
     Freeing memory for user provided Net
    
     Instance created for  tidl_infer.txt
     Freeing memory for user provided Net
     ----------------------- TIDL Process with TARGET DATA FLOW ------------------------
                 Layer,      Layer Cycles,  kernelOnlyCycles,    coreLoopCycles,  LayerSetupCycles,   dmaPipeupCycles, dmaPipeDownCycles,   ,
                     2,             36883,              6016,              8364,              9721,              8587,                 0,   ,
                     4,             19052,              2498,              4324,              6470,              1359,                 0,   ,
                     3,             42588,             12691,             13925,              7454,             16177,                 0,   ,
                     5,            857334,            838476,            840152,              7449,              3542,                 0,   ,
                     6,            153605,            106284,            137971,              6766,              3329,                 0,   ,
                     7,              4305,                 0,                 0,                 0,                 0,                 0,   ,
                     8,           8298601,           6632530,           8240011,             25763,             26563,                 0,   ,
                     9,            766165,            293578,            748085,              8683,              3988,                 0,   ,
     Sum of Layer Cycles 10178533 
    
    # NETWORK_EXECUTION_TIME =    11.06 (in ms, c7x @1GHz) with DDR_BANDWIDTH (Read + Write) =    63.52,    33.63,    97.16 (in Mega Bytes/f!
    REMOTE_SERVICE: Deinit ... !!!
    REMOTE_SERVICE: Deinit ... Done !!!
       120.927278 s: IPC: Deinit ... !!!
       120.928158 s: IPC: DeInit ... Done !!!
       120.928181 s: MEM: Deinit ... !!!
       120.928191 s: DDR_SHARED_MEM: Alloc's: 8 alloc's of 20015504 bytes 
       120.928200 s: DDR_SHARED_MEM: Free's : 8 free's  of 20015504 bytes 
       120.928207 s: DDR_SHARED_MEM: Open's : 0 allocs  of 0 bytes 
       120.928219 s: MEM: Deinit ... Done !!!
    APP: Deinit ... Done !!!
    root@j784s4-evm:/opt/tidl_7924# 
    CTRL-A Z for help | 115200 8N1 | NOR | Minicom 2.8 | VT102 | Offline | ttyUSB2