主题中讨论的其他器件: MATHLIB
尊敬的 TI 专家:
TMS320C6674用于实现我的算法。 该算法主要是矩阵操作。 计算金额约为1万亿次乘以运算。 它通过 MATLAB 转换为 C 语言(浮点双精度型)。 通过计算 TMS320C6674上的指令周期执行次数、处理延迟为287ms、超出预期。 我有几个问题:
1.您能不能就减少处理延迟和提高运行速度提出任何建议?
2、 定点数和浮点数的 TMS320C6674处理器的处理速度有何区别? 现在、算法是浮点数、是否需要将算法转换为定点数?
3.当前算法只有一个内核打开。 TMS320C6674多核如何自动开启或需要手动配置? 您能否提供演示或教程来打开多核以提高运行速度?
4. DDR3不能被读取或写入。 如何配置它? 是否有教程或演示?
谢谢、此致、
Thomas