摘要:提出基于LDA主题模型的蒙古文信息检索方法.利用LDA模型为蒙古文文档主题建模,利用吉普斯抽样学习算法推理间接计算模型的参数,挖掘隐藏在文档内不同主题与词之间的关系,得到文档的主题分布,并以此分布来计算与查询语句主题之间的相似度,最后返回与查询语句主题最相关的文档,从而实现蒙古文文档的主题语义检索.实验结果表明,LDA模型在蒙古文信息检索中与传统的向量空间模型和语言模型相比,在体现主题语义方面取得了较好的效果.
关键词:蒙古文 lda 吉布斯抽样 信息检索
单位:内蒙古师范大学计算机与信息工程学院; 内蒙古呼和浩特010022
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社