线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

基于Q-learning的不确定环境BDI Agent最优策略规划研究

万谦; 刘玮; 徐龙龙; 郭竞知 计算机工程与科学 2019年第01期

摘要:BDI模型能够很好地解决在特定环境下的Agent的推理和决策问题,但在动态和不确定环境下缺少决策和学习的能力。强化学习解决了Agent在未知环境下的决策问题,却缺少BDI模型中的规则描述和逻辑推理。针对BDI在未知和动态环境下的策略规划问题,提出基于强化学习Q-learning算法来实现BDIAgent学习和规划的方法,并针对BDI的实现模型ASL的决策机制做出了改进,最后在ASL的仿真平台Jason上建立了迷宫的仿真,仿真实验表明,在加入Q-learning学习机制后的新的ASL系统中,Agent在不确定环境下依然可以完成任务。

关键词:bdiagent强化学习asljason规划

单位:武汉工程大学计算机科学与工程学院; 湖北武汉430073; 智能机器人湖北省重点实验室; 湖北武汉430073

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程与科学

北大期刊

¥624.00

关注 46人评论|5人关注