线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

基于语义特征空间上下文的短文本表示学习

脱婷; 马慧芳; 魏家辉; 刘海姣 计算机工程与科学 2019年第02期

摘要:文本表示是自然语言处理中的基础任务,针对传统短文本表示高维稀疏问题,提出1种基于语义特征空间上下文的短文本表示学习方法。考虑到初始特征空间维度过高,通过计算词项间互信息与共现关系,得到初始相似度并对词项进行聚类,利用聚类中心表示降维后的语义特征空间。然后,在聚类后形成的簇上结合词项的上下文信息,设计3种相似度计算方法分别计算待表示文本中词项与特征空间中特征词的相似度,以形成文本映射矩阵对短文本进行表示学习。实验结果表明,所提出的方法能很好地反映短文本的语义信息,能对短文本进行合理而有效的表示学习。

关键词:语义特征空间相似度计算文本映射矩阵短文本表示

单位:西北师范大学计算机科学与工程学院; 甘肃兰州730070; 桂林电子科技大学广西可信软件重点实验室; 广西桂林541004

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程与科学

北大期刊

¥624.00

关注 46人评论|5人关注