线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

大规模英汉平行语料库的检索与应用:大数据视角

王克非; 刘鼎甲 外语电化教学 2017年第06期

摘要:本研究从大数据视角报告"大规模英汉平行语料库检索平台"的设计开发及其应用。首先,梳理了语料库检索问题中方法和技术的发展脉络;其次,介绍了面向一亿词级别英汉平行语料库检索的"大规模英汉平行语料库检索平台V2.0"的功能,该平台不仅具备单语检索、双语检索和搭配分析等基本功能,也提供元信息过滤、词形还原、模糊检索和支持正则表达式和通配符的Pro Conc语言的半结构化复杂检索等功能,可快速准确地从语料库中抽取信息,为基于英汉平行与历时类比语料库的翻译研究、翻译教学和双语词典编纂提供数据基础;第三,对比分析本研究所设计的方法与技术较之传统平行语料库检索技术的优势,分析了平台在实际语料库检索中的信度,借此为大数据背景下语料库的信息抽取研究提供借鉴。

关键词:平行语料库历时类比库语料库检索大数据

单位:北京外国语大学中国外语教育与研究中心; 北京市100089

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

外语电化教学

CSSCI南大期刊

¥408.00

关注 35人评论|6人关注