This thread has been locked.
If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.
你好,
首先谢谢您的回复!
但是由于我们的算法需要memcpy的数据不能以大块数据的形式搬移,只能点对点的赋值,或者说非常小批量的memcpy,我看到8168是基于VLIW的架构,可以使用字访问短型数据。
那么请问:是否可以在做memcpy时,利用超长指令字,将32个8位的数据同时读出来? 谢谢!
这个和VLIW关系不大,主要由数据通路带宽决定。8168的DSP有两个D单元,每个单元一次最大可以进行8字节的读取,因此如果你要用DSP来搬运数据的话,最快速度就是一个周期搬运8个字节(一个D单元读,一个D单元写)。但是要注意要达到这个性能的话,你的源和目的地址都需要按8字节对齐,否则会出错。
另外一点是你的算法在VC下优化到最优,并不能说明在DSP下就无法优化了。事实上PC和DSP的处理器架构差别很大,因此在PC上的运行性能不能代表在DSP上的运行性能。