您好:
我自己编写的一个大量数据运算的汇编代码,发现该汇编代码在simulator下运算时间和在c6678评估板上运行时间区别很大,评估板上运行时间是simulator下的2倍多,不知道是什么原因, 程序数据段都是放在片内的.
This thread has been locked.
If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.
你好:
我是在cycle approximate 下仿真的, 我编写的是2个32K个点向量做加法运算,流水循环核中平均每个运算是1.75个时钟周期,那么计算完这32K点所用时间应该大约是32*1024*1.75(这里排除了流水填充和排空的时间), 在simulator下计算的时间确实跟这个时间差不多,但是在c6678评估板上运行,发现时间是这个的2倍多, 我想知道是:会不会是lddw指令去L2取数据在数据总线上有延迟,导致整个时间消耗过多? 我的L1D,L1P全部配置成cache了,数据和代码全部放在L2.