线上期刊服务咨询,期刊咨询:400-808-1701 订阅咨询:400-808-1721

一种结合词向量和图模型的特定领域实体消歧方法

汪沛; 线岩团; 郭剑毅; 文永华; 陈玮; 王红斌 智能系统学报 2016年第03期

摘要:针对特定领域提出了一种结合词向量和图模型的方法来实现实体消歧。以旅游领域为例,首先选取维基百科离线数据库中的旅游分类下的页面内容构建领域知识库,然后用知识库中的文本和从各大旅游网站爬取到的旅游文本,通过词向量计算工具Word2Vec构建词向量模型,结合人工标注的实体关系图谱,采用一种基于图的随机游走算法辅助计算相似度,使其能够较准确地计算旅游领域词与词之间的相似度。最后,提取待消歧实体的背景文本的若干关键词和知识库中候选实体文本的若干关键词,利用训练好的词向量模型结合图模型分别进行交叉相似度计算,把相似度均值最高的候选实体作为最终的目标实体。实验结果表明,这种新的相似度计算方法能够有效获取实体指称项与目标实体之间的相似度,从而能够较为准确地实现特定领域的实体消歧。

关键词:实体消歧实体链接word2vec图模型随机游走

单位:昆明理工大学信息工程与自动化学院; 云南昆明650500; 昆明理工大学智能信息处理重点实验室; 云南昆明650500

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

智能系统学报

北大期刊

¥220.00

关注 30人评论|1人关注