摘要:为了提高中文关键词提取的准确率和实用性,提出了一种改进了候选词权重计算的关键词提取算法TFLD(term frequency,location&distance algorithm),利用候选词权重排序自学习,提高了提取关键词算法的效率。该方法采用词语词频统计、分布区域以及词语距离位序3种特征项,并使用最小均平方(LMS)法则训练算法模型的调整因子。实验结果表明,该方法提高了关键词提取的精度。
关键词:关键词提取 中文文本 中文信息处理
单位:杭州电子科技大学计算机应用技术研究所 浙江杭州310018 浙江育英职业技术学院 浙江杭州310013
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社