摘要:本文提出一种基于定性模糊网络的强化学习知识传递方法。该方法通过建立系统的定性模型,并用定性模糊网络抽取基于定性动作的次优策略的共同特征获得与系统参数无关知识。这些知识能有效描述参数值不同的系统所具有的共同控制规律,加快在新参数值的系统中强化学习的收敛速度。
关键词:强化学习 定性模型 知识传递
单位:湖南大学计算机与通信学院 湖南长沙410086 湖南工业职业技术学院信息工程系 湖南长沙410208 北京交通大学计算机与信息技术学院 北京100044
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社