线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

基于词向量与可比语料库的双语词典提取研究

柳路芳; 李波; 陈鹏; 周凌寒; 王兵 计算机工程与科学 2018年第02期

摘要:双语词典是跨语言信息检索以及机器翻译等自然语言处理应用中的一项重要资源。现有的基于可比语料库的双语词典提取算法不够成熟,抽取效果有待提高,而且大多数研究都集中在特定领域的专业术语抽取。针对此不足,提出了一种基于词向量与可比语料库的双语词典提取算法。首先给出了该算法的基本假设以及相关的研究方法,然后阐述了基于词向量利用词间关系矩阵从可比语料库中提取双语词典的具体步骤,最后将该抽取方法与经典的向量空间模型做对比,通过实验分析了上下文窗口大小、种子词典大小、词频等因素对两种模型抽取效果的影响。实验表明,与基于向量空间模型的方法相比,本算法的抽取效果有着明显的提升,尤其是对于高频词语其准确率提升最为显著。

关键词:双语词典词向量词间关系可比语料库

单位:华中师范大学计算机学院; 湖北武汉430079; 北京吉威时代软件股份有限公司; 北京100043

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程与科学

北大期刊

¥624.00

关注 46人评论|5人关注