摘要:本文提出了一种Cholesky分解细粒度流水线并行算法,该算法可以处理任意规模的数据,可以充分开发FP-GA加速器提供的细粒度并行。实验表明,该算法具有很好的可扩展性,在Xilinx XC5 VLX330 FPGA上能够集成36个处理单元(PE),当矩阵的阶为16384、运行频率为200MHz时性能达到14.3GFLOPS。
关键词:cholesky分解 细粒度并行 fpga
单位:国防科学技术大学计算机学院。湖南长沙410073
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社