摘要:研究了数据预处理方法对模糊C均值聚类结果的影响。通过对国际标准数据集IRIS和某电力公司所管辖的不同行业电力用户实际负荷数据,利用不同的方法进行预处理,运用模糊C均值聚类算法(FCM)进行聚类,并对实验结果进行了验证和比较。结果显示对于FCM聚类算法,通过总和标准化和极大值标准化方法对数据进行预处理后,FCM的平均准确度最高;Max-Min、平均数方差法两种方法处理后FCM聚类效果较差;用标准差标准化后聚类效果最差。进一步地,对标准差标准化做了相应的改进,改进后FCM聚类效果明显提高。
关键词:数据预处理 聚类 负荷特性 聚类准确率
单位:华北电力大学电气与电子工程学院 河北保定071003
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社