线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

大点数一维FFT的GPU设计实现

何涛 朱岱寅 计算机工程与科学 2013年第11期

摘要:鉴于GPU强大的计算性能以及先进的并行处理器架构,主要研究一种将FFT的并行算法映射到CUDA模型的并行设计方法.该设计方法遵循如减少内核函数中的全局存储器访问、全局存储器合并访问、高效利用共享存储器、高密集度计算等GPU平台下主要的设计准则进行优化设计,并在基于NVIDIAFermi处理架构的Tesla C2075 GPU平台上进行了大点数一维FFT设计实现.实验结果表明了该方法的可行性及高效性,在256K点范围内性能优于CUFFT库,加速比最高达到CUFFT 4.0库的2.1倍.

关键词:cuda4快速傅里叶变换gpu高性能计算

单位:南京航空航天大学电子信息工程学院江苏南京210016 中航工业雷达与电子设备研究院 江苏无锡214063 南京航空航天大学电子信息工程学院 江苏南京210016

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程与科学

北大期刊

¥624.00

关注 46人评论|5人关注