Xeon Phi平台上基于模板优化的3D GVF场计算加速

齐金李宽杨灿群杜云飞计算机工程与科学 2014年第08期

摘要：3D梯度向量流场（3D GVF field）广泛应用于多种3D图像分析算法中,其计算需要多次迭代,计算量大,如何提高其计算速度具有重要的研究意义.面向Intel Xeon Phi众核集成架构,首次进行了3D GVF场计算的加速优化.首先,挖掘3D图像像素点间存在的天然并行性,发挥众核架构优势,尝试线程级并行（多核）和数据级并行（SIMD）.其次,3D GVF场的计算过程是一种典型的3D 7点模板运算,结合Xeon Phi架构的L2缓存规格,提出一种高效的数据分块策略,充分挖掘数据的时/空局部性,有效缓解模板计算引起的缓存缺失,提升了计算性能.实验结果表明,引入模板优化技术能显著提升3DGVF场的计算速度,在图像维度为5123时,所提方法在57核Xeon Phi平台上的性能相比在2.6 GHz 8核16线程的Intel Xeon E5-2670 CPU上的性能,加速比可达2.77.

关键词：3d梯度向量流场 xeon phi 模板优化缓存分块

单位：国防科学技术大学并行与分布处理重点实验室湖南长沙410073 国防科学技术大学计算机学院湖南长沙410073

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

在线咨询期刊咨询

计算机工程与科学

北大期刊

￥624.00

关注 46人评论|5人关注

Xeon Phi平台上基于模板优化的3D GVF场计算加速

服务介绍

期刊推荐

订阅杂志

期刊咨询