摘要:为了解决多智能体系统中agent在形成联盟的时候不能同时保持系统全局优化解和联盟的稳定性问题,提出了一种联盟形成时的奖励策略,对于在联盟中执行任务的agent给以适当奖励,从而使得联盟在达到全局最优化解的同时保持稳定.在实验中,以Postman问题作为例子,对三种联盟形成策略即Shapley值策略、均分策略和奖励策略进行了比较.数据表明Shapley值策略和均分策略的时效性差,并且不能保证联盟的稳定性.相反,奖励策略是最有效的,它可以使得联盟达到全局优化解的同时保持稳定,并且时效性好.最后对奖励策略进行了性能分析,从理论上证明了奖励策略的优越性.
关键词:多智能体 联盟 奖励策略
单位:北京邮电大学灾备技术国家工程实验室; 北京100876; 北京应用气象研究所计算机室; 北京100029
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社