您好,
我使用8168的DVRRDK4.0开发包,将我的图像处理程序移植到DSP内核中执行,但是效率很慢,需要进一步优化,想请问一下,除了自己算法级别的优化,并使用DMA方式替换memcpy的地方,还有没有其它的方式呢?在这里是否存在开多线程的概念呢?
非常期待大家的指教,谢谢!
This thread has been locked.
If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.
你好,
首先谢谢你的回复,我还想再咨询一些问题:
1、关于你说的这里面只有一个DSP,所以多线程没有什么实际意义。这是基于如果是多个CPU的话,开多个线程运行在不同CPU上以提高效率的思路是吗?那么,针对我的算法程序,由于是一个循环体中对图像每个点做的是同样的操作,能否采用多线程将它们分为几个独立部分运行,对速度是否会有很大改善呢?
2、我现在的算法执行时间150ms/一帧图像,算法上已经进行了一些优化,最耗时的地方是一个300万次的循环,循环体中要做几次取值、赋值运算;现在我已经进行了循环展开。关于算法优化,你还能给些建议吗?
非常感谢!