摘要:文档表示是排序学习的关键,目前的排序学习算法多采用词袋法表示文档与查询,该方法假设词袋中的词相互独立,忽略了词之间的关系.为了表示文档中词之间的依赖关系,本研究利用文档与查询的主题特征构建排序学习模型,我们将排序函数定义为文档与查询之间的主题关系,提出了基于有监督主题模型的排序学习算法自动学习排序函数.为了评价模型的排序精度,我们在三个标准数据集(OHSUMED,MQ2007,MQ2008)上进行了实验.实验表明基于主题的排序学习算法能够发现文档与查询之间内在的语义关联,并改善排序模型的排序精度.
关键词:排序学习 机器学习 关系主题模型 主题特征
单位:哈尔滨工业大学深圳研究生院 广东深圳518055 计算机体系结构国家重点实验室 中科院计算所 北京100190
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社