请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
器件型号:TMS320C6678 您好、香榭丽舍
以下代码在共享存储器中的运行速度非常慢
无符号 短整型 *IN1、*IN2、*IN3、*IN4、*iN5、*IN6、*IN7、*IN8、*IN9、*IN10、*IN11;
IN1=imgin_ptr;
IN2=IN1+640;
in3=in2+640;
IN4=in3+640;
(笑声)
IN11=IN10+640;
out=imgout_ptr;
(i=0;i<256;i++)
{
for (j=0;j<640;j++)
{
总和=(IN1[0]+IN2[0]+...IN11[0])/11;
* OUT++SUM;
IN1++;
IN2++;
(笑声)
IN11++;
}
}
1.只有 Core0运行代码
2.启用高速缓存、L1P、L1D 32K、L2Cache 128K。
代码位于 LL2上
4.使用-O3.
处理640x512图像11x1需要大约3ms、1x11将减少时间。
如何优化代码以获得更好的性能。
谢谢。
Rgds
闪亮