This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] 编译器:有没有任何方法可以提高矩阵乘法的效率

Guru**** 2562910 points


请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/tools/code-composer-studio-group/ccs/f/code-composer-studio-forum/592554/compiler-is-there-any-way-to-improve-efficiency-of-matrix-multiplication

主题:OMAPL138中讨论的其它部件

工具/软件:TI C/C++编译器

您好,  

在我的SW设计中,矩阵乘法很少,我不确定哪种方法可以使其高效。 22乘22元素的矩阵乘法大约需要1毫秒。

我刚刚添加了数学头文件,不确定是否需要任何其他头文件,或者编译器中是否有任何优化设置可以改善计时。 还有一个代码在外部存储器中运行,不确定是否是问题所在。 欢迎提出任何建议。 谢谢。

此致,

Mitesh

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您使用的是什么目标设备?  什么是编译器(而不是CCS)版本?  请显示您的构建选项。

    谢谢,此致,

    -George

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    您好,
    目标器件为OMAPL-138,编译器版本为8.1 Tm2

    优化->--opt 3;--opt_for speed 4;和--opt_for空间2.
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Mitesh Hiran 说:
    目标器件为OMAPL-138,编译器版本为8.1。2[/QUOT]

    OMAPL138上有ARM和C6000 CPU。  我可以从编译器版本号得知您正在使用C6000 CPU来执行此代码。

    请尝试Wiki文章 C6000 CGT优化实验室中演示的一些技术

    谢谢,此致,

    -George

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    谢谢。