摘要:已有的以k-最近邻(kNearestNeighbor,kNN)规则为核心的分类算法,如模糊kNN(FuzzykNN,FkNN)和证据kNN(EvidentialkNN,EkNN)等,存在着两个问题:无法区别出样本特征的差异以及忽略了邻居距训练样本类中心距离的不同所带来的影响.为此,本文提出一种模糊.证据kNN算法.首先,利用特征的模糊熵值确定每个特征的权重,基于加权欧氏距离选取k个邻居;然后,利用邻居的信息熵区别对待邻居并结合FkNN在表示信息和EkNN在融合决策方面的优势,采取先模糊化再融合的方法确定待分类样本的类别.本文的方法在UCI标准数据集上进行了测试,结果表明该方法优于已有算法.
关键词:加权欧氏距离 模糊熵 折扣因子 证据理论
单位:河北师范大学物理科学与信息工程学院; 河北石家庄050024; 杭州电子科技大学自动化学院; 浙江杭州310018
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社