摘要:开放域问答是当前自然语言处理和信息检索领域的研究热点,作为开放域问答系统的重要组成部分,问题分类可以缩小答案的搜索空间并决定答案的选择策略.近年来,基于机器学习的问题分类技术受到广泛的关注,相关研究表明问题分类的准确性直接影响问答系统的整体性能.本文从分类体系与数据集、特征提取、分类器设计、性能评测等层面,总结了问题分类技术近年的主要研究成果.重点分析了各种基于监督学习的问题分类方法的特点和不足,讨论了核方法、半监督学习、主动学习、迁移学习等在问题分类中的应用,同时对问题分类技术未来研究动向进行了展望.
关键词:开放域问答 问题分类 机器学习 特征提取 分类器设计
单位:安徽工业大学计算机科学与技术学院 安徽马鞍山243032 南京大学计算机软件新技术国家重点实验室 江苏南京210023
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社