This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] TDA4VM:TDA4VM 存储器使用情况

Guru**** 2325560 points
Other Parts Discussed in Thread: TDA4VM
请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1036393/tda4vm-tda4vm-memory-usage

器件型号:TDA4VM

尊敬的支持人员:

我想问几个与内存使用相关的问题。 我正在 TDA4VM J721e 上进行开发、在启动期间、它显示它具有4GB 的 RAM、但是、登录后、"free"返回以下内容:

根目录@J7-EVM:~#免费
可用的可用空闲共享缓冲区/高速缓存总数
MEM:2585664 206720 2085312 36352 293632 2004864
交换:0 0 0

我想知道是否可以通过某种方式访问整个4GB 范围的 RAM 来运行我的应用程序?


出现的另一个问题是、当我尝试在 C66 DSP 上运行图形的预实施 TIVx 节点(如颜色转换节点或通道提取节点)时、这些 DSP 的 CPU 使用率会在每个 DSP 仅运行一个节点时跃升至80%、 当我将另一个节点(如一个 colorconv->channel 提取序列)连接在一起时,帧速率会显著下降,当我尝试将更多节点连接起来以便在 DSP 上按顺序运行时,性能会不断下降。

性能下降是否是由这些设备上的内存不足引起的? 在启动期间、我注意到以下部分:

[ 0.0000]、共:保留内存:已初始化节点 C66-dma-memory@a6000000、兼容 id shared-dma-pool
[0.000000]保留存储器:已创建 DMA 存储器池、地址为0x00000000a6100000、大小为15 MIB

我猜这些 DSP 可能会尝试使用这个15MB 内存池来运行它们给定的图形节点、当它们耗尽该内存时、会有一个需要花费大量时间的同步。 如果是这种情况、我是否可以让他们改用此内存池?

[0.000000]保留存储器:已创建 DMA 存储器池、地址为0x000000000000ce000000、大小为720 MiB
[ 0.0000]、共:保留内存:已初始化节点 vision_apps-core-heap-memory@ce000000、兼容 id shared_dma-pool

如果完全错误、请忽略我的猜测、但在这种情况下、您能否向我简要介绍如何在 C66 DPSS 上高效运行图形节点序列、以便不会对性能造成太大影响?

此致、
Bence

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    [引用 userid="484171" url="~/support/processors-group/processors/f/processors-forum/1036393/tda4vm-tda4vm-memory-usage "]

    我想知道是否可以通过某种方式访问整个4GB 范围的 RAM 来运行我的应用程序?

    [/报价]

    否! 由于 Linux 需要内存、 其他 内核也需要内存。
    我将让我的同事回答有关 TIVX 的问题。

    -凯尔西

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好 Bence、

    OpenVX 不执行任何运行时存储器分配、而是在创建时执行所有存储器分配。  有一个名为"vxVerifyGraph"的 OpenVX API 、如果存储器不足以让给定节点运行、该 API 将返回错误。  因此、由于图形能够在不出现此错误的情况下运行、因此有足够的内存来运行这些节点、因此无需更改内存映射。

    这些特定节点使用基于高速缓存的存储器访问、而不是 DMA、因此这是它们比预期速度慢的部分原因。

    此致、

    卢卡斯

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Lucas 和 Keerty、

    感谢您的回答。  我还有一个问题;根据您的经验、您认为运行多个链接在一起的节点是否现实(例如分段:颜色转换、通道提取、图像多路复用、重新映射、图像多路复用、 信道组合)、同时用于4个摄像头、预计至少15fps? 我的目标是从4个摄像头图像中创建 IPM 图像、以将其作为输入馈送到我的神经网络中、但我担心 C66的性能不足以处理此任务。

    此致、

    Bence

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好 Bence、

    这取决于几个不同的因素、例如摄像机的分辨率和您使用的确切节点。  如您所知、有2个不同的 C66 DSP、因此这些节点可以在任一 DSP 上运行。

    您可以查看以下数据表、其中包含给定节点的性能信息、以帮助您更好地估算用例中可能出现的情况。

    https://software-dl.ti.com/jacinto7/esd/processor-sdk-rtos-jacinto7/08_00_00_12/exports/docs/tiovx/docs/user_guide/TIOVX_PERFORMANCE_J721E_LINUX.html

    此致、

    卢卡斯