摘要:动态武器目标分配(Weapon Target Assignment,WTA)中的目标选择策略问题可以通过建立马尔可夫决策过程(Markov decision pmcesses,MDP)模型进行研究,但目前尚无有效求解此类较大规模的MDP问题中最优策略的算法.通过分析动态WTA问题的MDP模型特点,给出了求解该问题最优策略的改进算法.该算法主要在初始策略选取规则、策略改进规则以及最优策略的判断准则等方面进行了改进.该算法具有计算量小,节省内存,并可得到最优解等优点.最后,通过算例将该算法与传统算法进行了比较.改进算法可以用于解决较大规模的动态WTA中的策略优化问题。
关键词:运筹学 动态武器目标分配 算法 策略优化 马尔可夫决策过程
单位:国防科技大学信息系统与管理学院; 长沙410073; 中国人民解放军95851部队; 南京210046
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社