摘要:微处理器与DRAM之间速度差异越来越大,系统优化需要更多积极有效的方法来减少或隐藏访存延迟.数据预取是隐藏访存延迟的一种有效方法,本文在GCC编译器上实现了一种基于精确局部性分析的数据预取优化算法.对spec2000和NPB2.3的测试结果显示,实施了该优化的GCC平均性能比原来提高了9%.
关键词:gcc 数据预取 重用性 局部性 局部迭代空间
单位:江南计算技术研究所; 江苏; 无锡; 214083; 江南计算技术研究所; 江苏; 无锡; 214083; 江南计算技术研究所; 江苏; 无锡; 214083
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社