摘要:可读性指文本易于阅读的程度或性质,评估对外汉语文本可读性在对外汉语教学中十分重要。文章针对对外汉语文本可读性难以人工评估的问题,提出了一种基于随机森林算法的对外汉语文本可读性自动评估方法。该方法从基础特征、词性特征、等级特征和语法特征这四个维度提取特征,进行特征选择后在训练集上利用随机森林算法训练分类器,并在测试集上证实了该方法的有效性。
关键词:对外汉语 可读性评估 随机森林
单位:华中师范大学国家数字化学习工程技术研究中心; 湖北武汉430079
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社