摘要:软件工作量数据缺失是软件工作估算的一个难题.本文在朴素贝叶斯模型和EM(expecta-tionmaximization)算法的基础上,提出了针对软件工作量数据缺失的处理方法.首先,本文介绍了数据缺失的内在机理;然后,本文提出了基于朴素贝叶斯和EM算法的软件工作量预测的方法;之后,本文提出了两种软件工作量数据缺失处理方法:容忍数据缺失方法和修复缺失数据方法;最后,本文利用ISBSG和CSBSG软件工作量数据集验证了本文所提出的数据缺失处理方法.实验结果表明:本文所提出的两种缺失数据处理方法的性能要优于MINI修复方法结合SVM的分类模型;修复缺失数据方法的预测性能要优于容忍数据缺失方法;对于两个数据集来说,其每一类别的工作量数据都来自于一个高斯组件.
关键词:em算法 朴素贝叶斯 容忍缺失数据 修复缺失数据 软件工作量预测
单位:北京化工大学经济管理学院; 北京100029
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社