This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

关于c6678优化中浮点数取余,还有运行时间的问题。



各位工程师好:

我想请教两个关于c6678优化的问题。

问题一:如何在不破坏流水的情况下,对浮点数取余数,就像fmod函数那样?

问题二:编译后的反馈信息中计算的总clk为:

Total cycles (est.)         : 45 + min_trip_cnt * 7 = 109420

但是我用TSC测试实际运行的clk为:430071(有两个读取的buff在ddr)

另一个循环差别更大:

Total cycles (est.)         : 24 + min_trip_cnt * 4 = 62524 

实际测试:626466(只有一个读取的buff在ddr)

请问这样正常吗?