使用GPU加速分子动力学模拟中的非绑定力计算

吴强杨灿群葛振陈娟计算机工程与科学 2009年第A01期

摘要：在分子动力学模拟（MD）中，对非绑定力的计算需要花费大量的时间。本文提出了基于CUDA和Brook＋的两种双精度算法，分别在NVIDIA和AMD两款主流GPU上实现了非绑定力的计算，借助GPU的计算能力加速了整个MD程序。算法对MD进行了任务分割，采用区域分解的方法将非绑定力的计算映射到GPU的计算核心上，同时针对两款GPU的各自特点提出了线程块内共享存储、最小化数据集两种优化方法。性能测试结果表明，与Intel Xeon2．6GHzCPU的单核相比，43．2万粒子的高速粒子碰撞模拟，在配置NVIDIA Tesla C1060的系统上性能提高了6．5倍，在配置AMDHD4870的系统上性能提高了4．8倍。

关键词：gpu 分子动力学模拟 cuda