This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

C6678与C64x+系列处理器在处理速度方面问题



C6678文档中有段写到:

跟C64X+比乘累加能力是其4倍,C6678除D单元外,其他单元的处理的数据长度增加了,像M单元可以输出128bit位的结果,又在文档中看到C6678可以同时处理4个32*32bit的乘法,但我找遍所有指令,也没看到有同时处理4个32*32的运算的说明。有没有这样的指令呢?还是这个4个32*32bit的能力指的是M1与M2并行处理?还有C6678处理能力好像跟C64X+的一样?指令也没怎么增加,就多了些单精度,双精度的指令,延时还挺高的,具体体现在哪块呢?我通过在工程中引用imglib,查看汇编代码跟C64X+提供的差不多,没看出有什么特别之处。。

还请专家指点下,谢谢

  • 找到C66x新指令了,C66x指令集文档挺奇怪的,在专门介绍各功能单元(L/D/M/S)居然没有新添加的指令。。新添加的指令在Instruction Compatibility章节出现。而且挺纳闷的为什么imglib库中使用的汇编代码里没有使用到新添加的指令。

  • 由于C66x提供了丰富的内嵌指令,所以大部分代码直接使用内嵌指令即可达到高性能,所以根据需要有的直接使用内嵌指令,有的需要使用汇编达到更高的性能。还是跟应用性能要求有关。