摘要:词义消歧一直是自然语言处理领域的关键问题和难点之一。通常把词义消歧作为模式分类问题进行研究,其中特征选择是一个重要的环节。该文根据贝叶斯假设提出基于信息增益的特征选择方法,并以此改进贝叶斯模型。通过信息增益计算,挖掘上下文中词语的位置信息,提高贝叶斯模型知识获取的效率,从而改善词义分类效果。该文在8个歧义词上进行了实验,结果发现改进后的贝叶斯模型在消歧正确率上比改进前平均提高了3.5个百分点,改进幅度较大,效果突出,证明了该方法的有效性。
关键词:词义消歧 自然语言处理 信息增益 贝叶斯模型
单位:哈尔滨工程大学计算机学院 哈尔滨150001 哈尔滨工业大学 哈尔滨150001
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社