线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

异构系统的异步应用级Checkpointing技术

贾佳 计算机工程与科学 2011年第11期

摘要:应用级checkpointing技术是同构系统上最为常用和成熟的容错技术,但在异构系统下的应用还处于起步阶段,还没有一套严谨合理的针对异构系统架构和故障模型特点的实现方案和配置方法。针对这一现况,本文基于CUDA异构系统的体系结构和编程模型,对CUDA程序在CPU和GPU上的执行模式进行分析,提出了一种面向异构系统应用级checkpointing技术的异步执行机制,并基于这一机制对异构系统的检查点优化设置问题进行讨论,设计了一套优化方案。最后在cUDA平台下通过三个实例验证了这一技术的可行性和实用性,并进行了性能评估。结果表明,这种面向CPU—GPU的异构系统的应用级checkpointing异步执行机制是行之有效的,相比CPU—GPU同步执行的checkpointing机制在设置上更为灵活,优化空间更大。而本文基于这一机制所提出的检查点优化设置方法也有效地减少了check—pointing的开销,从而获得了更高的容错性能。

关键词:应用级checkpointing技术异构系统异步执行机制检查点最优化设置

单位:并行与分布处理国防科技重点实验室 湖南长沙410073

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程与科学

北大期刊

¥624.00

关注 46人评论|5人关注