线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

带有缺失数据的一种动态聚类方法

肖静 骆如九 宋雯 汤在祥 徐辰武 中国农业科学 2012年第21期

摘要:【目的】探讨实际问题研究中的不完全数据聚类。【方法】利用相关变量的辅助信息,对缺失数据进行推估,确定其合理的替代值,从而构造出一个“完全”数据集。在此基础上以EM算法循环迭代,参数的估计值和缺失数据的替代值都将逐渐收敛,以相应的贝叶斯后验概率判别个体的归类,进而实现动态聚类。【结果】模拟研究表明,缺值替代法具有较好的收敛性,对有缺失的数据基本都可正确地聚类。【结论】Fisher的鸢尾花花类识别数据验证了缺值替代法的可行性,其聚类的准确性高于缺值删除法,基本接近完全数据聚类。

关键词:聚类分析缺失数据后验概率极大似然估计

单位:南通大学公共卫生学院流行病与卫生统计学教研室 江苏南通226019 扬州大学江苏省作物遗传生理重点实验室 江苏扬州225009 苏州大学医学部公共卫生学院流行病与卫生统计学教研室 江苏苏州215123

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

中国农业科学

北大期刊

¥1288.00

关注 25人评论|2人关注