我想同步8核对信号进行FFT处理,但是同步内核的话哪种方法比较推荐?我之前看了看IPC相关的资料,但是更多的是核间通信,可是我的项目里希望能让8个核同时运行FFT,应该用openmp么还是有什么更简洁的方法?希望有经验的人能指教一二!!
谢谢了!!
This thread has been locked.
If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.
我想同步8核对信号进行FFT处理,但是同步内核的话哪种方法比较推荐?我之前看了看IPC相关的资料,但是更多的是核间通信,可是我的项目里希望能让8个核同时运行FFT,应该用openmp么还是有什么更简洁的方法?希望有经验的人能指教一二!!
谢谢了!!
没有倒序,直接存储的请问你们的64KFFT运行时间大概是多少?我把我的工程文件上传了你帮忙运行一下吧,看看哪儿需要改进?我们的项目要求点数为64K复数floa的FFT运行时间在2ms以内,麻烦你给指导一下后者把你们的FFT程序发过来我学习一下,谢谢!
存在的问题:
1.修改cache大小、设置prefetch对运行时间没有改善
我做了两个实验:
1.把输入数据、旋转因子、输出数据直接存储在SL2中,运行时间为3ms
存储位置为:
/*******数据存储位置SL2中***************/
#define Input_Address (0x0C100000)
#define W_Address (0x0C200000)
#define Output_Address (0x0C300000)
2.把输入数据、旋转因子、输出数据直接存储在DDR3中,运行时间为8ms
存储位置为:
/*******数据存储位置DDR3中***************/
/#define Input_Address (0x81000000)
#define W_Address (0x82000000)
#define Output_Address (0x83000000)