摘要:针对支持向量数据描述(Support Vector Data Description,SVDD)的训练集中同时含有正常点和离群点的问题,为降低离群点对SVDD训练模型的不利影响,提出了一种基于单簇核可能性C-均值的SVDD离群点检测算法.本文算法通过单簇核聚类获得每个样本属于正常类的隶属度,将其作为每个样本属于目标类的置信度.将样本置信度引入到SVDD训练模型中,减弱低置信度样本在建立决策边界中的作用.实验表明,与已有的相关方法相比,本文方法能够显著改善SVDD的离群点检测效果.
关键词:离群点检测 支持向量数据描述 置信度
单位:
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社