摘要:互联网农技推广社区每秒增衍问答数据近万组,这些海量数据具有隐性的词性、情感和冗余向量特征,实现数据聚合与数据块消减是该领域的难题。提出了一种基于卷积神经网络的农业问答情感极性特征抽取分析模型,结合农业分词字典,对数据集进行分词后使用Skipgram模型转换为256维的词向量,利用批规范后的卷积神经网络对数据集进行训练,从而得到用于识别农技推广社区问答词性情感相似性的神经网络模型参数。试验结果表明,该方法能够准确识别测试样例集中的冗余队列,与其他5种文本分类方法进行比较,各项指标优势明显,针对测试集的语性特征抽取准确率达到82.7%。
关键词:农业信息分类 特征提取 自然语言处理 卷积神经网络
单位:国家农业信息化工程技术研究中心; 北京100097; 北京农业信息技术研究中心; 北京100097; 农业农村部农业信息软硬件产品质量检测重点实验室; 北京100097
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社