摘要:随着近年来知识自动化、机器学习和人工智能等领域研究和应用的逐步深入,作为与这些领域相关的基础研究课题之一,文本相似度计算的重要性日益凸显。由于汉语书写的特点,导致中文文本相似度计算较英语等其他自然语言的处理又更加复杂。本文在对近二十年来被引证次数较多的一些相关文献进行分析研究的基础上,从词语、句子、段落及篇章等层面,着重基于语义理解的方法,对汉语文本相似度计算研究的情况进行了综述。
关键词:文本相似度计算 文献综述
单位:北京市陈经纶中学; 北京100020
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社