摘要:文中首先通过语言学特征表来对文本信息进行结构化处理,同时实现了对远距离约束的表示;然后借助于面向个体的数据泛化算法来去除语言学特征表中的冗余信息,并利用规则抽取算法过滤特征表中不一致的部分,从而为相应的自然语言处理任务建立了一个一致、高效的规则库.最后,本文研究了模型在汉语词义排歧以及音字转换中的应用,在采用了动态规则平滑算法后,分别获得了 0.93和 0.95的判别精度以及0.92和0.89的覆盖率,这一结果显示模型具有很高的实用性.
关键词:浯言学知识发现 粗糙集 自动排歧 汉语音字转换 音字转换
单位:哈尔滨工业大学计算机科学与技术学院; 黑龙江; 哈尔滨; 150001
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社