线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

融合共现距离和区分度的短文本相似度计算方法

刘文; 马慧芳; 脱婷; 陈海波 计算机工程与科学 2018年第07期

摘要:针对短文本内容简短、特征稀疏等特点,提出一种融合共现距离和区分度的短文本相似度计算方法。一方面,该方法在整个短文本语料库中利用两个共现词之间距离计算它们的共现距离相关度。另一方面通过计算共现区分度来提高距离相关度的准确度,然后对每个文本中词项进行相关性加权,最后通过词项的权重和词项之间的共现距离相关度计算两个文本的相似度。实验结果表明,本文提出的方法能够提高短文本相似度计算的准确率。

关键词:短文本共现距离相关度共现区分度词项加权相似度计算

单位:西北师范大学计算机科学与工程学院; 甘肃兰州730070; 桂林电子科技大学广西可信软件重点实验室; 广西桂林541004

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程与科学

北大期刊

¥624.00

关注 46人评论|5人关注