摘要:自动作文评分中一项重要的特征就是语言错误。该特征的准确识别和提取,既能为作文评分提供依据,又可为学生提供详尽的语言使用情况的反馈。通过统计大规模英语语料库中词汇前后接续的频次,获得本族语词汇二元接续数据,并据此对中国大学生英语作文进行标注并分析低频接续情况,发掘出低频接续但属于正确使用的语言规律,构造过滤规则。结合使用过滤规则后与词频分布数据,词汇接续错误识别准确率接近69%,从而能够为自动作文评分和反馈提供更多的支持。
关键词:二元接续 错误识别 大学英语写作 自动作文评分
单位:广东外语外贸大学外国语言学与应用语言学研究中心 广东广州510420 华南理工大学外国语学院 广东广州510640
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社