C6678文档中有段写到:
跟C64X+比乘累加能力是其4倍,C6678除D单元外,其他单元的处理的数据长度增加了,像M单元可以输出128bit位的结果,又在文档中看到C6678可以同时处理4个32*32bit的乘法,但我找遍所有指令,也没看到有同时处理4个32*32的运算的说明。有没有这样的指令呢?还是这个4个32*32bit的能力指的是M1与M2并行处理?还有C6678处理能力好像跟C64X+的一样?指令也没怎么增加,就多了些单精度,双精度的指令,延时还挺高的,具体体现在哪块呢?我通过在工程中引用imglib,查看汇编代码跟C64X+提供的差不多,没看出有什么特别之处。。
还请专家指点下,谢谢