动态武器目标分配问题中策略优化的改进算法

陈英武; 蔡怀平; 邢立宁系统工程理论与实践 2007年第07期

摘要：动态武器目标分配（Weapon Target Assignment，WTA）中的目标选择策略问题可以通过建立马尔可夫决策过程（Markov decision pmcesses，MDP）模型进行研究，但目前尚无有效求解此类较大规模的MDP问题中最优策略的算法．通过分析动态WTA问题的MDP模型特点，给出了求解该问题最优策略的改进算法．该算法主要在初始策略选取规则、策略改进规则以及最优策略的判断准则等方面进行了改进．该算法具有计算量小，节省内存，并可得到最优解等优点．最后，通过算例将该算法与传统算法进行了比较．改进算法可以用于解决较大规模的动态WTA中的策略优化问题。

关键词：运筹学动态武器目标分配算法策略优化马尔可夫决策过程