1、CCS5.1,库函数版本为dsplib_c66x_3_1_0_0,测试4096个32位浮点数的乘法(函数名好像是DSPF_sp_vecmul(const float *x1,const float *x2,int nx,const float *y))
帮助里有个测试报告显示该库函数运行效率为 3/4*Nx+22 个时钟周期,这样计算的话,运行时间应该是3/4*4096+22=3094ns=3.094us(1G主频),而我实测时间远大于这个值,在10us以上,输入输出数据放在L2和L3影响不是很大,L2 Cache开了128KB
请问是我分析的理论时间有问题还是我测试的时间有问题??
2、编写库函数时,输入参数const 和 restrict 关键字都是不相关的意思吧,请问有什么异同??
望给予答复,谢谢!