This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] TMS320C6678:C6678图像处理代码在共享存储器中的运行速度非常慢

Guru**** 2562990 points


请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/596391/tms320c6678-c6678-image-processing-code-run-very-slowly-in-shared-memory

器件型号:TMS320C6678

您好、香榭丽舍

以下代码在共享存储器中的运行速度非常慢

无符号 短整型 *IN1、*IN2、*IN3、*IN4、*iN5、*IN6、*IN7、*IN8、*IN9、*IN10、*IN11;

IN1=imgin_ptr;

IN2=IN1+640;

in3=in2+640;

IN4=in3+640;

(笑声)

IN11=IN10+640;

out=imgout_ptr;

(i=0;i<256;i++)

     for (j=0;j<640;j++)

     {

      总和=(IN1[0]+IN2[0]+...IN11[0])/11;

     * OUT++SUM;

      IN1++;

     IN2++;

      (笑声)

     IN11++;

      }



1.只有 Core0运行代码

2.启用高速缓存、L1P、L1D 32K、L2Cache 128K。

代码位于 LL2上

4.使用-O3.

处理640x512图像11x1需要大约3ms、1x11将减少时间。

如何优化代码以获得更好的性能。

谢谢。

Rgds
闪亮