一种基于奖励机制的agent联盟形成策略

李剑; 景博; 杨义先电子学报 2008年第B12期

摘要：为了解决多智能体系统中agent在形成联盟的时候不能同时保持系统全局优化解和联盟的稳定性问题,提出了一种联盟形成时的奖励策略,对于在联盟中执行任务的agent给以适当奖励,从而使得联盟在达到全局最优化解的同时保持稳定.在实验中,以Postman问题作为例子,对三种联盟形成策略即Shapley值策略、均分策略和奖励策略进行了比较.数据表明Shapley值策略和均分策略的时效性差,并且不能保证联盟的稳定性.相反,奖励策略是最有效的,它可以使得联盟达到全局优化解的同时保持稳定,并且时效性好.最后对奖励策略进行了性能分析,从理论上证明了奖励策略的优越性.

关键词：多智能体联盟奖励策略