TI 大牛们,工程师们好,
我们现在在DM8148EVM上做基于adboost算法的人脸检测程序,目前发现处理速度相当慢,耗时10秒,才能处理一张200*200的图片。我们认为,这个速度显然不合理。我想知道,我们的优化是不是没有做好。
- 主要是尽可能使用intrinsic函数,其实也没有几个可以用的;
- 把opt_level 调到了3, optimization for code size 设置为0, optimize for speed 设置为5;
- 各种#pragma设置,如MUST_ITERATE, PROB_ITERATE, FUNC_ALWAYS_INLINE;
- 很多buffer基本都开在DDR上,因为L2RAM 太小了。
问题如下:
- 我们用profile clock测试,发现执行一个c= _mpy(a, b)都得40几个cycles,我们换成 c = a * b;同样也需要好几十个cycles。这是什么原因呢?
- 我们现在DSP 工程师不带操作系统,用的是seed-xds560v2仿真器,请问主频是20M还是750M呢?怎么看当前DSP工作频率?
- 麻烦您纠正下我们的优化错误。