摘要:从在线文本评论挖掘消费者情感信息,能够得到更加真实的消费者购买体验及其偏好。主题情感混合模型作为一类有效的无监督情感分类模型,正在成为这方面的重要文本挖掘工具,但该模型存在分类准确率和稳定性还不够高的问题,为克服这一不足,提出一种基于主题相似性的无监督在线评论情感分类模型。以潜在狄利克雷模型分析在线评论主题,结合情感词典计算主题情感极性;引入理想评论并构造理想评论代表集,通过计算评论和理想评论集的主题相似度,实现在线评论情感分类。实验结果表明,该模型能有效判别消费者在线评论情感倾向,稳定性较高,衡量分类结果的综合指标F1值比现有主题情感混合模型提高3%~20%。同时,在计算机、酒店、图书及手机等不同领域评论数据集上的实验结果显示,该方法具有较好的领域可移植性。
关键词:情感分析 在线评论 潜在狄利克雷模型 理想评论
单位:大连理工大学系统工程研究所; 辽宁大连116023
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社