强化学习理论在电力系统中的应用及展望

余涛周斌甄卫国电力系统保护与控制 2009年第14期

摘要：强化学习理论是人工智能领域中机器学习方法的一个重要分支，也是马尔可夫决策过程的一类重要方法。所谓强化学习就是智能系统从环境到行为映射的学习，以使奖励信号（强化信号）函数值最大。强化学习理论及其应用研究近年来日益受到国际机器学习和智能控制学术界的重视。系统地介绍了强化学习的基本思想和算法，综述了目前强化学习在安全稳定控制、自动发电控制、电压无功控制及电力市场等方面应用研究的主要成果与方法，并探讨了该课题在电力系统运行控制中的巨大潜力，以及与经典控制、神经网络、模糊理论和多Agent系统等智能控制技术的相互结合问题，最后对强化学习在电力科学领域的应用前景作出了展望。

关键词：人工智能强化学习马尔可夫决策过程随机最优控制电力系统