测试了在不开DDR2 cacheability、不开cacheability、L2中三种情况下计算效率。开了cacheability的计算效率是明显的,大概是不开的6-8倍。但是将数据全部放在L2中计算的效率只是开了DDR2 cacheability的1.3倍左右,另外我将大块的数据EDMA到L2中计算其效率是开DDR2 cacheability的1.2倍(比全部在L2中多了EDMA启动开销)左右,感觉这个提升幅度有低。理想情况EDMA搬移数据到L2中计算,其效率应该是在开启DDR2 cacheability的效率的几倍?谁能解释下这个没有大幅的效率提升可能是什么原因。