线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

语料库短语序列提取系统的设计与开发

卫乃兴; 李峰; 李晶洁 外语电化教学 2017年第04期

摘要:语料库短语序列提取一直是短语学研究的关键技术环节。囿于计算和操作的复杂性,前人研究多使用相对单一的统计方法测量和提取短语序列,导致提取的数据包含大量噪音。文章使用前沿的大数据处理手段和计算技术,实现了基于频数、互信息、边界熵等多种统计手段的短语序列提取方法,并研制开发了相应的系统。实验结果表明,该系统能够在普通计算机上支持千万词级规模的大型语料库运算,并能显著提高短语序列的提取质量。

关键词:语料库驱动短语序列自动提取设计与开发

单位:北京航空航天大学; 北京市100191; 中国人民解放军后勤科学研究所; 北京市100166; 东华大学; 上海市201620

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

外语电化教学

CSSCI南大期刊

¥408.00

关注 35人评论|6人关注