摘要:通过分析模具制造项目工期、费用与报酬的不确定性以及模具返修、随机插单等突发事件频繁发生的特点,构建了基于离散时间马尔可夫链的模具制造项目群随机演化模型,提出了求解该随机动态规划模型的算法。通过并行启发式策略进行仿真和多步Q学习,有效解决了“维数灾难”问题,结合示例阐述了算法执行过程,说明了其可行性与可靠性。与标准Q学习方法相比,多步Q学习方法能够有效提高算法收敛速度。
关键词:模具制造项目群 随机动态规划 马尔可夫链 并行启发式仿真 多步q学习
单位:广东工业大学 广州510090
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社