摘要:自然语言处理(Natural Language Processing,NLP)是目前人工智能研究领域中的一个热门方向,而文本处理是自然语言处理的一个具体任务,指使用计算机借助人工智能技术对文本语言进行处理的相关技术以及应用。本文针对中文文本分类,首先阐述了朴素贝叶斯算法的基本原理,然后分析研究了文本处理技术,具体包括利用jieba工具库进行中文分词、构建文本词向量模型及特征权重策略等关键技术,最后根据采集的真实物理题数据集进行了模型训练及测试实验来验证分类效果。本文通过实验表明,基于朴素贝叶斯算法的机器学习分类器模型可以有效地实现物理题题型分类,并给出了相应的查准率及查全率。
关键词:机器学习 文本分类 朴素贝叶斯 题型分类
单位:洛阳市第一高级中学; 河南洛阳471000
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社