摘要:针对复杂、动态环境中多Agent协作的稳定性问题,提出了一种基于博弈论及惩罚机制的协作方法,通过效用函数来选择最优策略,实现均衡协作;为了提高协作的稳定性与成功率,引入惩罚机制,通过不断调整惩罚系数来维护多Agent协作的稳定性,并在形成协作团队时,充分考虑参与协作的Agent的信誉值。仿真结果表明,该方法能有效地降低任务完成时间,避免Agent在动态协作中随意退出,提高协作效率及协作稳定性。
关键词:演化博弈 协作 惩罚机制 信誉值
单位:河南师范大学计算机与信息工程学院 河南新乡453007 智慧商务与物联网技术河南省工程实验室 河南新乡453007
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社