This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

AM5728 opencv使用opencl加速问题

Other Parts Discussed in Thread: AM5728

测试环境:3套AM5728 开发板均测试过,使用SD卡启动,最新版 3.2版SDK, 3.1版SDK, 3.0版SDK,均测试过。

export OPENCV_OPENCL_DEVICE='TI AM57:ACCELERATOR:TI Multicore C66 DSP' 环境变量配置

测试算法和结果:

形态学腐蚀算法:

erode(in_image, out_image, element);

算法循环次数10000次。

使用Opencl 耗时166225ms

未使用Opencl耗时 165889ms

 

dilate_opencl(in_image, out_image, element);

算法循环次数10000次。

使用Opencl 耗时167123ms

未使用Opencl耗时 166283ms

 

Sobel(src, dst_x, src.depth(), 1, 0);

Sobel(src, dst_y, src.depth(), 0, 1);

convertScaleAbs(dst_x, dst_x);

convertScaleAbs(dst_y, dst_y);

addWeighted(dst_x, 0.5, dst_y, 0.5, 0, dst);

算法循环次数100次。

使用Opencl 耗时14573.1ms

未使用Opencl耗时 14536.6ms

均没有得到明显的加速。

同样程序在 PC 测试环境下测试结果:

形态学腐蚀算法:

erode(in_image, out_image, element);

算法循环次数 10000次。

使用Opencl 耗时28999ms

未使用Opencl耗时 82914ms

 

dilate_opencl(in_image, out_image, element);

算法循环次数10000次。

使用Opencl 耗时28234ms

未使用Opencl耗时 89367ms

 

Sobel(src, dst_x, src.depth(), 1, 0);

Sobel(src, dst_y, src.depth(), 0, 1);

convertScaleAbs(dst_x, dst_x);

convertScaleAbs(dst_y, dst_y);

addWeighted(dst_x, 0.5, dst_y, 0.5, 0, dst);

算法循环次数100次。

使用Opencl 耗时1201ms

未使用Opencl耗时 40058ms

看到明显的加速效果

此测试结果和 TI 在 processors.wiki.ti.com/.../OpenCV 给出的测试结果差距很大,请问一下我是遗漏了什么配置吗?