工具/软件:
尊敬的专家:
我们的基准测试表明、C29 用于各种用途的代码运行速度是 C28 的 2 倍以上。 然而,我的客户发现,只有大约 30%的改善。
什么因素可能导致此问题?
- 他们在 3 级优化中使用 TI CLANG
- 我听说 早期编译器中缺少链接时优化功能、这是否仍然是一个问题
此致、
挂起。
This thread has been locked.
If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.
工具/软件:
尊敬的专家:
我们的基准测试表明、C29 用于各种用途的代码运行速度是 C28 的 2 倍以上。 然而,我的客户发现,只有大约 30%的改善。
什么因素可能导致此问题?
此致、
挂起。
挂起、
他们对什么类型的代码进行基准测试? 最好使用真实算法或接近真实算法的算法。 我询问是因为我看到客户尝试对重复的一两个操作进行基准测试。 没有利用所有并行处理单元的优势。
这里有 F29 优化指南: https://www.ti.com/lit/pdf/sprujg0
请根据他们的代码检查建议、如果您有疑问、请告知我们。 链接后优化仍在进行中。
此致
Lori
挂起、
有了像这样的定性细节,就不可能知道发生了什么。
他们是否了解了 sprujg0 和其中列出的优化?
几个关键示例:
-除了 O3,是-ffast-math 启用?
-他们的代码中是否有 atan、atan2 和其他 RTS 函数,如 fmod、roundf 等? 在即将推出的 2.0.0.STS 中、这些算法在编译器中高效实现(前提是使用了-ffast-math 设置)。
他们能否与我们分享代码以进行分析?
谢谢、
Sira