线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

神经网络文本分类8篇

时间:2023-06-13 09:27:15

神经网络文本分类

神经网络文本分类篇1

关键词:仿生态神经网络群 神经网络集成 车型识别

中图分类号:TP391 文献标识码:A 文章编号:1007-9416(2015)11-0000-00

Abstract: According to the similarity of ecosystem model and multiple neural network model, the paper proposed the model of bionic neural network group (BNNG) algorithm, which combines the feature extraction and AR model to improve the accuracy of the vehicle classification, and reduces the error rate.

Key words: Bionic Neural Network Group; Neural Network Ensemble; Vehicle Recognition

神经网络集成是计算机模式识别及群智能理论的研究主要方向,目前神经网络集成还没有形成统一的理论框架,集成的内部依然是一个黑箱问题,里面权值和结构到底发生了哪些变化,没有形成统一的结论。本文在研究多种神经网络分类识别的实验中,发现了神经网络集成理论同生态系统模型有着一定的相似度,故对其进行模型预测,同时利用交通车型识别来验证本模型的正确性。

1 仿生态神经网络群算法(BNNG)的模型提出

生态系统是自然界的一个完美的动态进化模式,其内部进化靠互助、竞争等规则来完成,神经网络群按照生态系统进化规则进行演变,故称之为仿生态神经网络群。

神经网络集成是用有限个神经网络对同一个问题进行学习,集成在输入示例下的输出由构成神经网络集成的各神经网络在此示例下的输出共同决定。需要经过大量数据的训练和检验才能够达到最终理想的输出,内部各网络之间是交叉相错的,彼此之间的依存、竞争同样使其结构达到最终的平衡。生态系统模型与神经网络集成有一定的相似性,本出简单模型匹配预测,具体如表1。

2 仿生态神经网络群算法(BNNG)数学模型构建

根据生态群落进化规则,本文将BNNG算法分为主体网络和激励网络,具体算法结构如图1。

传统神经网络模型分为输入层(input)、隐层(hide layer)和输出层(output layer),处理信息的基本原理是:输入信号通过中间节点(隐层点)作用于输出节点,经过非线形变换,产生输出信号,网络训练的每个样本包括输入向量X和期望输出量T,网络输出值Y与期望输出值T之间的偏差,通过调整输入节点与隐层节点的联接强度取值和隐层节点与输出节点之间的联接强度以及阈值,使误差沿梯度方向下降,经过反复学习训练,确定与最小误差相对应的网络参数(权值和阈值),训练即告停止。此时经过训练的神经网络即能对类似样本的输入信息,自行处理输出误差最小的经过非线形转换的信息,本次假设训练样本为,学习率为,第个样本的误差为。其中

输出公式: (2-1)

全局误差公式: (2-2)

隐层各神经元的权值调整公式为:?? (2-3)

输出层各神经元的权值调整公式为: (2-4)

而BNNG的输出公式为: (2-5)

3 仿生态神经网络群(BNNG)模型在车型识别中的应用

车型识别是交通量在线统计中的重要步骤,识别率的高低直接影响着整个系统的好坏,所以选取此类实验来验证具有重要价值,本文选择4种车型,各40个样本进行验证,具体如表2。

本次BNNG网络群的主体网络为BP(Feed-forward backprop)、CBP(Cascade-forward backprop)、EBP(Elman backprop)、TBP(Time-delay backprop)四种,激励网络由最基本的原始神经网络组成,如Perceptron、Radial basis(exact fit)、Radial basis(fewer neurons)、Generalized regression、Linear layer(design),验证方式为先单一网络分类,然后是主体网络分类,最后是将激励网络和主体网络融合形成BNNG网络后进行分类,通过正确识别率验证各种算法的有效性,具体结果如表3。

通过表3可以看出主体网络的识别率要比单一网络或单个网络的识别率要高,适当引入激励网络将大大提高车型的识别率问题,识别率可以提高到95%以上,其恰好是模型匹配进化的重要规则之一,验证了模型的正确性。

4结语

本文提出仿生态神经网络群(BNNG)算法一种新的模型,按照生态演变规则对网络进行建立、进化。通过实验数据分析得出仿生态神经网络群确实和自然界生态平衡模型存在着一定的相似性,比如竞争机制,演变结果的可能性,对单个物种作用低的处理机制等方面运行规则相似。经过实验验证能够为神经网络集成理论统一框架提供理论和实验参考价值,为在复杂情况下的模式识别提供新的方法和依据。

参考文献

[1]宋锐,张静.一种基于BP神经网络群的自适应分类方法及其应用[J].电子学报,2001年第12A期:1950-1953.

[2]王双维,陈强.不同车型的车辆声音与振动信号特征研究[J].声学技术,2007年第3期:460-463

[3]陈强,李江,王双维.基于AR模型的车型自动分类技术[J].吉林大学学报(工学版),2007年第2期:325-328.

[4]余佳,李益华.一种基于数据挖掘的车型自动分类方法的研究[J].现代电子技术,2012年第9期:119-121,124.

神经网络文本分类篇2

关键词: 改进的LVQ神经网络; 发动机; 故障诊断; 神经元

中图分类号: TN98?34 文献标识码: A 文章编号: 1004?373X(2015)17?0107?03

Fault diagnosis for engines based on improved LVQ neural network

GUO Zengbo1, BA Yinliang2, WANG Shuti2, XIE Xin2

(1. Karamay Vocational & Technical College, Karamay 834000, China;

2. College of Machinery and Traffic, Xinjiang Agricultural University, Urumqi 830052, China)

Abstract: Since learning vector quantization (LVQ) neural network can classify input vector pattern accurately by supervised learning, the fault diagnosis method for engines based on LVQ neural network is proposed. LVQ neural network and its improved learning method are introduced. Taking Great Wall Harvard GW2.8TC engine as the experimental subject, faults are set for the engine under idle speed condition. The data stream of the engine is collected by using Kinder KT600 computer fault diagnosis tester. The diagnosis model was established by using the improved LVQ neural network. The diagnosis results show that the improved LVQ neural network can classify engine faults accurately, and the precision rate is relatively high.

Keywords: improved LVQ neural network; engine; fault diagnosis; neurone

0 引 言

人工神经网络(Artificial Neural Networks,ANNs),也称为神经网络(NNs),是模拟生物神经网络进行信息处理的一种数学模型。它以对大脑的生理研究成果为基础,目的在于模拟大脑的某些机理与机制,实现一些特定的功能。由于人工神经网络具有联想记忆功能、优化计算能力以及其他的一些性质,所以人工神经网络具有较强的分类识别功能。学习向量量化(LVQ)神经网络是常用的一种神经网络,LVQ神经网络是一种有导师训练竞争层的方法,竞争层自动学习识别输入向量,并对输入向量分类。

本文以长城哈佛GW2.8TC型发动机为例,运用LVQ神经网络对发动机进行故障诊断。

1 LVQ神经网络

1.1 LVQ神经网络结构

LVQ神经网络是两层的网络结构,即竞争层和线性层。竞争层对输入向量进行学习分类,把竞争层的分类称为子分类;线性层根据用户的要求将竞争层的分类结果映射到目标分类结果中,把线性层的分类称为目标分类。LVQ神经网络结构如图1所示。

由图1可以看出,竞争层和线性层每一类别各有一个神经元,竞争层通过学习,可以得到S1类子分类结果;然后,线性层将S1类子分类结果再分成S2类目标分类结果(S1始终大于S2)。例如,假设竞争层的第1,2,3个神经元对输入空间的子分类所对应的线性层的目标分类为第2类,则竞争层的第1,2,3个神经元与线性层的第2个神经元的连接权将全部为1,而与其他线性层神经元的连接权全部为0,这样,当竞争层的第1,2,3个神经元中的任意一个神经元在竞争中获胜时,线性层的第2个神经元将输出1。

1.2 LVQ神经网络学习算法的改进

LVQ神经网络学习算法的改进是在LVQ1的基础上进行的,它可以改善LVQ1学习结果的性能。

改进的LVQ网络的学习过程与LVQ1类似,在应用LVQ1进行学习后,再用改进的LVQ网络进行学习,不同的是,改进的LVQ是针对最接近输入向量的两个相邻神经元的权值进行的,其中一个神经元对应正确的分类模式,另一个神经元对应错误的分类模式,而输入向量位于定义的窗口时,有:

[mindidj,djdi>s,s=1-ω1+ω] (1)

式中:[di,][dj]分别表示输入向量[p]与[iIW1,][jIW1]的欧几里得距离,[ω]在0.2~0.3之间取值。例如,当[ω]取为0.25时,[s]=0.6,那么,当[di]和[dj]两个距离之比大于0.6时,则对[iIW1]和[jIW1]进行调整。

当第[i]个神经元对应的输出分类模式错误时,[IW1]的第[i]行可以按下式进行修正:

[iIW1(q)=iIW1(q-1)-αp(q)-iIW1(q-1)] (2)

当第[j]个神经元对应的输出分类模式正确时,[IW1]的第[j]行可以按下式进行修正:

[jIW1(q)=jIW1(q-1)+αp(q)-jIW1(q-1)] (3)

这样,如果给定两个很相近的输入向量,其中一个对应正确的分类,而另一个对应错误的分类,则改进的LVQ也能对靠的非常近,甚至对刚刚可分的模式进行正确地分类,从而提高分类结果的鲁棒性。

2 改进的LVQ神经网络在发动机故障诊断中

的应用

基于改进的LVQ神经网络在发动机中的故障诊断仿真步骤如下:

(1) 让发动机处在怠速状态下,并对其进行故障设置,用电脑检测仪及其他设备测出发动机有无故障时的数据流参数;

(2) 用改进的LVQ神经网络建立诊断模型,并用已知的样本数据训练网络;

(3) 用训练好的网络对发动机进行故障诊断,并对训练结果进行分析。

2.1 发动机故障设置及采集样本

为了验证改进的LVQ神经网络在发动机故障诊断中的可行性,本文以长城哈佛GW2.8TC型发动机为研究对象,让发动机在怠速状况下,对发动机进行故障设置,并利用金德KT600故障诊断仪采集发动机数据流。以发动机在正常怠速、油门踏板1接地线开路、凸轮轴传感器线路故障、1缸喷油器线路故障、冷却液温度传感器线路串联某阻值电阻和油门踏板插头开路六种状态下,采集发动机数据流,采集到的样本数据如表1所示。

2.2 程序设计

在Matlab环境中,调用LVQ神经网络工具箱,创建的代码如下:

在代码中,[p]中数据为样本数据;[t]中以1表示正常状态,以2表示故障状态;T=ind2vec(t)为使[t]中的向量转换成学习向量量化网络使用的目标向量;net=newlvq()为创建LVQ神经网络,神经元数目设置为20,0.17和0.83,分别表示所采集的样本种类中正常状态和故障状态所占的比例,网络学习率设为0.5;net=init(net)为网络初始化,使其每次训练时权值都是随机的,这样可以达到预期的目标;网络训练步数设置为200;训练间隔设置为50;训练目标设置为0;网络设置好后,开始训练网络,运行程序后所得的网络训练状态图如图2所示,训练曲线如图3所示。

由图2和图3所示,网络训练只训练了8次,用时不到1 s,就达到了预期目标,可见,用改进的LVQ神经网络进行故障诊断,速度非常快,精确度很高。

3 结 语

LVQ神经网络将监督学习和无监督学习结合起来,可以完成对输入向量模式的准确分类。本文以长城哈佛GW2.8TC型发动机为实例,并对发动机进行故障设置,采集数据流,介绍了LVQ神经网络及其改进的学习算法,运用改进的LVQ神经网络建立诊断模型,诊断结果表明,改进的LVQ神经网络能对发动机故障进行模式识别和准确分类,诊断结果完全正确,而且训练速度极快。改进的LVQ神经网络具有较高的研究价值,该方法不仅可以运用到汽车诊断领域,而且可以运用到其他故障诊断领域。

参考文献

[1] 董长虹.神经网络与应用[M].北京:国防工业出版社,2005.

[2] 史忠植.神经网络[M].北京:高等教育出版社,2009.

[3] 孙祥,徐流美,吴清.Matlab 7.0[M].北京:清华大学出版社,2005.

[4] 周开利,康耀红.神经网络模型及其Matlab仿真程序设计[M].北京:清华大学出版社,2005.

[5] 张德丰.Matlab神经网络应用设计[M].北京:机械工业出版社,2009.

[6] 李国勇.智能控制及其Matlab实现[M].北京:电子工业出版社,2005.

[7] 舒宁,马洪超,孙和利.模式识别的理论与方法[M].武汉:武汉大学出版社,2004.

[8] 蒋宇,李志雄,唐铭.LVQ神经网络在滚动轴承故障诊断中的应用研究[J].机械科学与技术,2011(3):408?411.

神经网络文本分类篇3

(1.克拉玛依职业技术学院,新疆克拉玛依834000;2. 新疆农业大学机械交通学院,新疆乌鲁木齐830052)

摘要:学习向量量化(LVQ)神经网络可以通过监督学习完成对输入向量模式的准确分类,提出了一种基于改进的LVQ神经网络的发动机故障诊断方法,介绍了LVQ神经网络及其改进的学习算法。以长城哈佛GW2.8TC型发动机为实验对象,让发动机在怠速状况下,对发动机进行故障设置,利用金德KT600电脑故障诊断仪采集发动机数据流,运用改进的LVQ神经网络建立诊断模型,诊断结果表明,改进的LVQ神经网络能对发动机故障做出正确分类,准确率比较高。

关键词 :改进的LVQ神经网络;发动机;故障诊断;神经元

中图分类号:TN98?34 文献标识码:A 文章编号:1004?373X(2015)17?0107?03

0 引言

人工神经网络(Artificial Neural Networks,ANNs),也称为神经网络(NNs),是模拟生物神经网络进行信息处理的一种数学模型。它以对大脑的生理研究成果为基础,目的在于模拟大脑的某些机理与机制,实现一些特定的功能。由于人工神经网络具有联想记忆功能、优化计算能力以及其他的一些性质,所以人工神经网络具有较强的分类识别功能。学习向量量化(LVQ)神经网络是常用的一种神经网络,LVQ神经网络是一种有导师训练竞争层的方法,竞争层自动学习识别输入向量,并对输入向量分类。

本文以长城哈佛GW2.8TC 型发动机为例,运用LVQ神经网络对发动机进行故障诊断。

1 LVQ 神经网络

1.1 LVQ神经网络结构

LVQ神经网络是两层的网络结构,即竞争层和线性层。竞争层对输入向量进行学习分类,把竞争层的分类称为子分类;线性层根据用户的要求将竞争层的分类结果映射到目标分类结果中,把线性层的分类称为目标分类。LVQ神经网络结构如图1所示。

由图1可以看出,竞争层和线性层每一类别各有一个神经元,竞争层通过学习,可以得到S1类子分类结果;然后,线性层将S1类子分类结果再分成S2类目标分类结果(S1始终大于S2)。例如,假设竞争层的第1,2,3个神经元对输入空间的子分类所对应的线性层的目标分类为第2类,则竞争层的第1,2,3个神经元与线性层的第2个神经元的连接权将全部为1,而与其他线性层神经元的连接权全部为0,这样,当竞争层的第1,2,3 个神经元中的任意一个神经元在竞争中获胜时,线性层的第2个神经元将输出1。

1.2 LVQ神经网络学习算法的改进

LVQ 神经网络学习算法的改进是在LVQ1 的基础上进行的,它可以改善LVQ1学习结果的性能。改进的LVQ网络的学习过程与LVQ1类似,在应用LVQ1 进行学习后,再用改进的LVQ 网络进行学习,不同的是,改进的LVQ 是针对最接近输入向量的两个相邻神经元的权值进行的,其中一个神经元对应正确的分类模式,另一个神经元对应错误的分类模式,而输入向量位于定义的窗口时,有:

这样,如果给定两个很相近的输入向量,其中一个对应正确的分类,而另一个对应错误的分类,则改进的LVQ也能对靠的非常近,甚至对刚刚可分的模式进行正确地分类,从而提高分类结果的鲁棒性。

2 改进的LVQ 神经网络在发动机故障诊断中的应用

基于改进的LVQ神经网络在发动机中的故障诊断仿真步骤如下:

(1)让发动机处在怠速状态下,并对其进行故障设置,用电脑检测仪及其他设备测出发动机有无故障时的数据流参数;

(2)用改进的LVQ神经网络建立诊断模型,并用已知的样本数据训练网络;

(3)用训练好的网络对发动机进行故障诊断,并对训练结果进行分析。

2.1 发动机故障设置及采集样本

为了验证改进的LVQ神经网络在发动机故障诊断中的可行性,本文以长城哈佛GW2.8TC 型发动机为研究对象,让发动机在怠速状况下,对发动机进行故障设置,并利用金德KT600故障诊断仪采集发动机数据流。以发动机在正常怠速、油门踏板1接地线开路、凸轮轴传感器线路故障、1缸喷油器线路故障、冷却液温度传感器线路串联某阻值电阻和油门踏板插头开路六种状态下,采集发动机数据流,采集到的样本数据如表1所示。

2.2 程序设计

在Matlab环境中,调用LVQ神经网络工具箱,创建的代码如下:

在代码中,p 中数据为样本数据;t 中以1表示正常状态,以2表示故障状态;T=ind2vec(t)为使t 中的向量转换成学习向量量化网络使用的目标向量;net=newlvq()为创建LVQ 神经网络,神经元数目设置为20,0.17 和0.83,分别表示所采集的样本种类中正常状态和故障状态所占的比例,网络学习率设为0.5;net=init(net)为网络初始化,使其每次训练时权值都是随机的,这样可以达到预期的目标;网络训练步数设置为200;训练间隔设置为50;训练目标设置为0;网络设置好后,开始训练网络,运行程序后所得的网络训练状态图如图2所示,训练曲线如图3所示。

由图2和图3所示,网络训练只训练了8次,用时不到1 s,就达到了预期目标,可见,用改进的LVQ神经网络进行故障诊断,速度非常快,精确度很高。

3 结语

LVQ神经网络将监督学习和无监督学习结合起来,可以完成对输入向量模式的准确分类。本文以长城哈佛GW2.8TC 型发动机为实例,并对发动机进行故障设置,采集数据流,介绍了LVQ神经网络及其改进的学习算法,运用改进的LVQ神经网络建立诊断模型,诊断结果表明,改进的LVQ 神经网络能对发动机故障进行模式识别和准确分类,诊断结果完全正确,而且训练速度极快。改进的LVQ 神经网络具有较高的研究价值,该方法不仅可以运用到汽车诊断领域,而且可以运用到其他故障诊断领域。

参考文献

[1] 董长虹.神经网络与应用[M].北京:国防工业出版社,2005.[2] 史忠植.神经网络[M].北京:高等教育出版社,2009.

[3] 孙祥,徐流美,吴清.Matlab 7.0[M].北京:清华大学出版社,2005.

[4] 周开利,康耀红.神经网络模型及其Matlab仿真程序设计[M].北京:清华大学出版社,2005.

[5] 张德丰.Matlab神经网络应用设计[M].北京:机械工业出版社,2009.

[6] 李国勇.智能控制及其Matlab实现[M].北京:电子工业出版社,2005.

[7] 舒宁,马洪超,孙和利.模式识别的理论与方法[M].武汉:武汉大学出版社,2004.

[8] 蒋宇,李志雄,唐铭.LVQ 神经网络在滚动轴承故障诊断中的应用研究[J].机械科学与技术,2011(3):408?411.

神经网络文本分类篇4

Abstract: In order to improve the problem that single neural network model has slow convergence speed, we adopt combination neural network modeling method. We established a network model of the gas turbine performance simulation, and it was validated by experiment. In the course of modeling, the modeling object is divided into three relatively independent sub-networks. We use the training domain obtained by experimental data to train the network, and set up a combined neural network model that can be used for gas turbine control system simulation and fault diagnosis. The experimental results show that the average output error of this model is about 3% - 6%, the calculation time is less than 100ms, and it can be used for model-based gas turbine diagnosis system.

关键词: 燃机故障分类;故障诊断;组合神经网络

Key words: gas turbine;fault diagnosis;neural network

中图分类号:TK4文献标识码:A文章编号:1006-4311(2010)29-0138-03

0引言

燃气轮机是一种洁净、高效的动力装置。然而,由于燃气轮机设备结构复杂,影响其运行的因素较多,且其长期工作在高温、高压状态下,很多部件有可能发生故障。一旦设备出现故障停止运转,则需要投入大量的精力与时间来进行维修,带来巨大的经济损失,有时甚至会对工作人员的生命安全造成威胁。由于燃气轮机故障诊断能大幅度降低维修成本,同时也能大大提高机组运行的安全性和可靠性,所以对燃气轮机故障诊断系统的研究不仅有很大的理论意义,而且有较好的实用价值。

目前,对燃气轮机故障诊断的研究多采用基于BP神经网络的故障诊断方法。虽然BP单神经网络可以诊断多个故障,但它仍存在一定的缺陷:要实现对多个故障模式的诊断,网络需要对大量的故障样本进行学习,但构造反映多种故障样本的特征向量不是件容易的事;诊断多类故障的网络结构难以确定,即便确定了,往往也会出现网络节点过多、结构过于复杂等现象;当出现新的故障时,单神经网络的记忆必须全部消除,然后重新训练,工作量极大。针对以上几点,本文在BP神经网络的基础上将单神经网络按照一定原则进行分解,组成多个子神经网络,子神经网络结构相对简单,易于操作,相对而言更适用于大型复杂机械的故障诊断。

1组合神经网络模型的建立

1.1 组合神经网络模型简介神经网络能学习复杂、非线性关系,可以充当基于模型方法中的数学模型部分,还可以充当广义模式匹配器[1]。近年来,神经网络的研究和应用有了很大的发展,神经网络以其诸多优点,在故障诊断领域受到高度的重视,并得到广泛的研究和应用。

组合神经网络模型,即是将一定数量的个体神经网络组合在一起,并行的训练同一个任务,它最初是由Hansen和Salamon提出的。研究表明,由多个神经网络进行组合而构成的组合神经网络模型在泛化能力上得到了非常大的提高,效果明显优于单一网络模型[2]。组合神经网络模型结构如图1所示。

组合神经网络由多个子神经网络组成,子神经网络将单神经网络的诊断任务进行分解,负责诊断对象某个子系统的故障。子神经网络结构简单,训练所需的样本数量少,训练速度快。而且,当系统出现新故障时,组合神经网络可以通过添加新的子网络来进行处理,不需要重新训练,扩展性能强。

1.2 燃气轮机故障分类燃气轮机是一种简单开式循环双轴结构工业机组,它的设计和生产引入了模块的概念,使得燃气轮机的辅助系统分别设计、加工成标准模块,并对其标准模块进行试验,然后组装。这使得燃机具有可靠性强、适应性强、寿命长的特点。燃气轮机主要包含以下几个模块:燃气发生器、动力透平、、燃料、启动、监测和冷却系统模块。

由于燃气轮机结构的复杂性及其工作环境的多变性,导致其故障类型及故障模式纷繁复杂,从总体上看可分为3类:

1.2.1 性能型故障这种故障能导致机组性能的显著下降,性能型故障多表现在机组最大负荷下降,耗油率过高,部件效率下降,涡轮排气温度过高,压气机喘振等。

1.2.2 结构强度型故障这类故障的后果较为严重,表现为机组强度不足引起的破裂与损伤,高、低压疲劳损伤,热疲劳损伤等,如压气机叶片磨损及断裂。

1.2.3 辅助系统型故障这种类型的故障往往会诱发前述两种类型的故障,如控制系统的故障会导致压气机转速不稳定这类性能型故障,继而有可能导致压气机叶片断裂这类结构强度型故障。

根据从现场采集的数据资料,文中将燃气轮机经常发生的故障进行了筛选、分类,并绘制了表1。

上表中燃气轮机有两种类型的信号:状态量和连续量。状态量信号通常使用一维的数值就可以表示,例如,液体燃料阀开关(0表示该液体燃料阀开,1表示该液体燃料阀关)、油箱温度(66℃)。连续量信号是自变量为连续的时间变量的信号,燃气轮机信号中大部分信号均为连续量信号,如压力、压差等。

1.3 组合神经网络模型设计组合神经网络中的子神经网络结构简单,训练非常迅速,各子神经网络之间互不影响,各自诊断该子网络故障特征对应的故障。当系统出现新的故障特征及其对应的故障时,只需增加一个新的子神经网络或修正某一子神经网络即可,这样就大大提高了整个网络的扩展性和学习能力。

1.3.1 子网络的设计组合神经网络模型由若干个子神经网络组成,子网络的结构特性会直接影响组合神经网络的诊断效果。故而在设计子网络时,应遵循以下组成原则:使各子网络之间的相关性尽量小,即训练子神经网络的样本应尽量不同;不同测点上测得的各类故障声强信号之间的相关性很小,因此可按不同测点对样本进行分组,然后将分组后的样本分别用于子神经网络的训练;同时,计算每组样本数目在总样本数目中所占的比例,并将比例值作为每组子网络的可信度eg。

基于以上原则,我们将用于燃气轮机故障诊断的组合神经网络分为三个子神经网络:燃料子神经网络、子神经网络及透平子神经网络。

文中三个子神经网络的设计均采用了BP算法。BP算法将神经网络学习输入输出的映射问题转变为一个非线性优化问题,使用了最优化中最普遍的梯度下降算法,用迭代运算修正网络权重,实现网络输出与期望输出间的均方差最小化。该算法由前向计算过程和误差反向传播过程组成。

根据神经网络的要求和所要达到的网络输出目的,本文选择神经网络层间的传递函数为Sigmoid型函数,即为:f(x)=

其函数图像为:

1988年,Cybenko指出:当各节点均采用Sigmoid型函数时,一个隐含层就足以实现任意的判断分类问题,两个隐含层就足以表示输入图形的任意输出函数。这个结论对BP网络隐含层数目的确定具有指导性意义。根据实际情况,本文所设计的子神经网络均采用单隐层结构。

图2是组合神经网络中诊断燃料子系统故障的子神经网络。图3是组合神经网络中诊断子系统故障的子神经网络。图4是组合神经网络中诊断透平子系统故障的子神经网络。

1.3.2 子网络的整合Hansen和Salamon在Neural network ensembles一文中已经证明了:对于一个组合神经网络模型,如果一个模式正确分类的平均率小于50%,且组合神经网络模型中的个体网络的误差是独立的,则随着个体网络个数的无限增加,该模式分类的期望误差将逐渐趋于零。然而,这一假设在实际应用中很难实施,主要是因为实际操作中并不能保证各个体网络之间是相互独立的。

由于燃气轮机各个系统之间都具有一定的相互依存关系,不能保持绝对的相互独立,本文在保证个子神经网络相对独立的基础上,将燃气轮机故障诊断的组合神经网络结构设计如图5。

1.3.3 组合神经网络的训练组合神经网络的训练就是对网络中的子网络进行训练,本文为子网络输出的各个故障组织了3组样本进行训练。

这里我们将网络的输入信号进行了归一化处理,将信号处理到[0,1]区间内。

2结语

①针对故障训练样本采用归一化处理能很好地减小样本数据间的差异,提高网络诊断的正确率。②结合燃气轮机故障诊断的特点,用组合神经网络判别不同的故障种类,提高了网络的训练效率和诊断的准确性。通过对诊断实例的计算分析表明,用基于BP算法的人工神经网络模型作为基本分类器构建的组合神经网络在燃气轮机故障诊断中能够取得比较理想的结果,故障实例检测结果表明该算法判断模式、诊断结果均准确。

参考文献:

[1]张建华,张俊华,侯国莲.神经网络在故障诊断中的应用[J].电力学报,1998,13(4):1.

神经网络文本分类篇5

本文主要研究了采用数字图像处理技术对现有的AUV拍摄的海底图像进行处理,获得了包括海底输油管道、岩石、沙滩和沟壑等特征的大量图像样本,并用BP神经网络对样本进行训练,以获得成熟的BP网络,利用该网络可以提高对水下管道图像的判断效率,大大的增强了AUV视觉系统的工作性能。

【关键词】图像处理技术 海底输油管道 BP神经网络

自主式水下机器人(Autonomous Underwater Vehicle,AUV)是人们探索海底资源和进行海洋活动的重要工具。由于AUV的独特优势,其在海底石油管线巡检中正发挥着越来越大的作用。AUV在工作时实现管道追踪和航线轨迹规划主要依靠声学或光学等手段。当AUV距离管道目标较近时,AUV的水下成像和处理系统可以生成较为清晰直观的管道图像并实时存储,这些图像除了能让AUV实现光学上的轨迹导航,后期还能帮助作业人员分析管道的状态,判断管道的腐蚀和破坏程度,给后续施工提供参考材料。

另一方面,由于水下环境较为复杂,AUV水下成像系统所拍摄的底片常常包含有各种噪点和背景物。因此,为了提高水下成像和处理系统的工作质量和效率,有必要对图片进行数字化处理,以准确获取信息,实现AUV对管道的高效追踪和巡检。

为了实现这一目的,本文首先研究了采用图像信号处理的方法对水下图像进行处理,通过计算机数字图像处理,本文获得了大量优质的可用于分析的水下图像;其次,本文利用神经网络的相关方法,采用BP神经网络对获得的水下图像进行分类识别,经过网络训练,获得了具有较好分类效果的BP神经网络,可以对不同目标物的图像进行分类识别。本文的主要研究思路如图1所示。

1 常见的水下图像类型

为了验证本文提出的图像处理及BP神经网络分类方法的有效性,我们选取了几类典型的通过的水下图像,分别为分布有石块的海底、海底沙滩、海底沟壑和海底输油管道,具体图像见图2。

本文将利用数字图像技术对这几种典型的水下图像进行处理,以获得供BP神经网络训练的优质样本。

2 水下图像数字处理技术

要对水下图像进行分析和识别,首先需要大量包含丰富信息的优质数字图像,以便进一步的分析。本文将获得水下图像进行灰度变换、中值滤波、模糊增强和阈值化等数字处理技术进行处理,以获得可以更好为计算机软件识别的特征信号,通过此方法获得的数字图像可以作为本文研究的基础。图3为常见的两种水下仿真图像经过处理后的数字图像。

3 基于BP神经网络的水下图像的分类和识别

3.1 BP神经网络水下图像识别的基本原理

要对水下图像进行机器识别必须先对其图像特征进行描述。根据相关研究文献,本文选择图像中目标物长径比、伸长度、圆形度、一阶不变矩4个特征参数来对水下目标中最常见的输油管道、分布有石块的海底、海底沙滩、海底沟壑进行描述;通过研究这4类特征参数在不同图像中的不同值,来确定水下样片中的核心图像为管道还是岩石、沟壑等物。

BP神经网络即后反馈神经网络,是一种改进型的神经网络,该神经网络可以以任意的精度逼近任意一个连续函数,利用BP神经网络可以很好地实现预测和分类的功能。

本文采用BP神经网络,以经过数字技术处理后的水下图像为研究对象,以长径比、伸长度、圆形度、一阶不变矩为判定指标,对图像进行了分类识别研究。

从通过前文介绍方法采集到的水下数字图像中,选择出10组作为BP网络研究的样本,通过matlab计算每张图像中的4个特征参数,获得图像类型与特征参数的关系如表1所示。

3.2 定义输入和输出样本数据

(1) 定义输入样本数据。从表1中的10组数据中随机选择6组(序号分别为:1、3、6、7、8、10)作为输入样本,经数据归一化以后输入Matlab软件。

(2)对输出状态进行编码。输出为4维向量,定义期望输出向量如表2所示。

(3) 构建BP神经网络:由于本文构建的网络的输入和输出情况较为简单,为了简化网络结构,提高运算速度,采用包含一个隐含层结构的BP神经网络。其中,网络输入单元为4种水下图像的特征参数,输出单元为4种海底图像形貌。根据网络为4-x-4结构形式,由经验公式可知隐含层节点数为3~13之间的整数,计算每个值对应的表征神经网络性能的均方误差值(MSE),可知当隐含层层节点数为4时,得到的MSE值最小为26,因此,网络的隐含层节点数选为4。本文所用BP神经主要传递函数为“logsig”和“purelin”函数。

(4)BP神经网络的训练。在Matlab中应用输入和输出样本向量对网格进行训练,定义期望误差为1e-6。训练过程中,BP神经网络经过13次迭代之后达到了满意的期望误差限。

(5)利用BP神经网络进行水下图像的分类判断。下面利用所有的10个样本对训练出的神经网络进行测试检验,在Matlab中输入表1中归一化后的所有数据,获得网络的输出数据,经过整理,结果如表3所示。由表3可看到,经过训练后的BP神经网络可以很好地对各个样本的状态进行判断分类,且判断的结果具有很高精度。另一方面,表中2组和9组样本的诊断出现了错误。为了提高网络诊断精度,可以在训练样本中加入这个样本,重新对网络进行训练。

4 结束语

视觉探测系统是AUV的重要系统,影响着其海底管道巡检的工作效率,而水下图像的分类识别技术又是视觉探测系统的核心。本文主要利用了计算机数字图像技术对海底图像原片进行处理,提取其特征后,利用BP神经网络进行训练,获得成熟的网络以用于图像的分类,最后得到的目标图像可用于AUV的光学轨迹导航等。本文的研究思路对相关AUV水下目标识别与跟踪等研究领域有一定借鉴意义。

参考文献

[1]李左车.AUV管道巡检的相关研究与工程应用[J].机器人,2013,35(4):56-59.

[2]李亚兵.水下图像增强算法的研究[D].中国海洋大学硕士学位论文,2008

[3]高俊.基于神经网络的视觉检测方法[J].计算机工程,2005.35(4):76-81.

[4]左宾.神经网络技术在数字图像分类中的应用[J].光学技术,2012,22(1):45-51.

作者简介

高本国(1986-),男,云南省昆明市人。硕士学位。现为昆明船舶设备研究试验中心助理工程师,主要从事机械结构设计方面的工作。

神经网络文本分类篇6

关键词:粒子群 径向基 神经网络 语音识别

中图分类号:TP391 文献标识码:A 文章编号:1007-9416(2013)04-0109-02

近年来,语音识别作为一种便捷的人机交互方式被大量研究,并在日常生活中得到广泛应用。大体上讲,语音识别就是在给定的语料库中找出与待识别词语相同的语料,其识别方法的选择对识别效果至关重要。语音识别的方法主要有3种:基于语音特征和声道模型的方法、模板匹配的方法和人工神经网络[1]。第1种方法出现较早,但由于其模型过于复杂,并未得到实际应用。第2种方法较为成熟,主要通过动态时间规整(DTW)、隐马尔可夫模型(HMM)和矢量量化(VQ)技术实现[2]。第3种方法充分利用人工神经网络较强的分类能力和输入——输出映射能力,非常适合解决语音识别这类难以用算法描述而又有大量样本可供学习的问题[3]。

因此,本文将智能领域广泛使用的RBF神经网络运用到语音识别中,针对RBF神经网络隐层基函数的中心值和宽度随机确定的缺陷,运用具有全局寻优能力的粒子群算法(PSO)进行优化,来提高网络的泛化能力和收敛速度,从而提高识别率。实验结果表明,粒子群优化的RBF神经网络用于语音识别,能够显著提升识别性能。

1 粒子群优化RBF神经网络

1.1 RBF神经网络

1.2 粒子群优化RBF网络算法

因此,RBF神经网络隐层基函数中心值和宽度的优化过程就是PSO算法依据输入样本进行聚类的过程,其基本流程为:

(1)参数初始化,包括粒子速度、位置,个体最优位置和全局最优位置;

(2)据(5)式计算惯性权重;

(3)据(3)(4)式更新粒子的速度和位置;

(4)据(6)式计算各粒子适应度值,并更新个体最优位置和全局最优位置;

(5)用全局最优粒子代替本次迭代适应度差的粒子;

(6)反复迭代,直到最大迭代次数则停止,得聚类中心。

2 PSO优化RBF语音识别系统

语音识别过程主要包括信号预处理、特征提取、网络训练及识别[6]。预处理主要对语音进行分帧、预加重和加窗处理。特征提取用于提取语音中反映声学特征的相关参数,本文采用的是过零峰值幅度(ZCPA)。网络训练是在识别之前从语音样本中去除冗余信息,提取关键参数,再按照一定规则对数据加以聚类,形成模式库。网络识别是通过已训练好的网络,计算测试样本数据与模式库之间的相似度,判断出输入语音所属的类别。粒子群优化RBF神经网络的语音识别系统原理框图如图1所示。

PSO优化RBF神经网络进行语音识别的实验步骤如下:

第1步:提取特征。

首先对用于训练和识别的各种信噪比的语音文件进行ZCPA特征提取。语音信号的采样频率为11.025kHz,每帧为256个采样点,经过时间和幅度归一化处理后,得到256维特征矢量序列。

第2步:网络训练。

网络训练的过程就是调整RBF神经网络基函数的中心和宽度以及隐层到输出层之间的连接权值。实验中,类别数为待识别的词汇数,如对10个词进行识别,则隐层节点数、输出层节点数和聚类中心均为10,如对20个词进行识别,则隐层节点数、输出层节点数和聚类中心均为20,以此类推,本文对10词、20词、30词和40词分别进行训练识别。利用PSO优化算法通过聚类获取隐层基函数的中心值和宽度,网络输出权值使用伪逆法得到。在PSO算法中,种群大小为20,最大进化迭代次数为40。

第3步:网络识别。

RBF神经网络训练好后,将测试集中的样本输入网络进行识别测试。每输入一个单词的特征矢量,经过隐层、输出层的计算后可得一个单词分类号,将这个分类号与输入词自带的分类号进行对比,相等则认为识别正确,反之,识别错误。最后将识别正确的个数与所有待识别单词数的比值作为最终的识别率。

3 实验仿真分析

本文运用matlab在PC机上仿真实现了PSO优化RBF神经网络的孤立词语音识别系统,选用在不同高斯白噪声条件下(包含15dB、20dB、25dB和无噪声),18个人分别录制40词各三次,形成实验语音数据,实验时选其中10人的10词、20词、30词、40词语音数据分别作为训练样本,另外8个人对应的10词、20词、30词、40词语音数据分别作为测试样本进行实验,得到了不同噪声和词汇量下的粒子群优化RBF神经网络的语音识别结果。

表1所示为在不同词汇量和不同SNR下,分别基于PSO优化RBF神经网络和标准RBF神经网络采用ZCPA语音特征参数的语音识别结果。由表中识别率的变化可知,基于PSO优化的RBF神经网络的识别率在不同词汇量和不同信噪比下都比标准RBF神经网络的高,正确识别出的词汇量明显增多,这充分证明改进后的RBF神经网络具有自适应性和强大的分类能力,缩短网络训练时间的同时,提高了系统的识别性能,尤其在大词汇量的语音识别中表现出更加明显的优势。

4 结语

本文采用粒子群优化算法来聚类RBF神经网络隐层基函数中心值和宽度,并将PSO改进的RBF神经网络用于语音识别中。通过仿真实验,得出了其与标准RBF神经网络在不同词汇量和不同SNR下的语音识别结果。通过分析比较,证明了PSO优化后的RBF神经网络有较高的识别率,且训练时间明显缩短,表明神经网络方法非常适宜求解语音识别这类模式分类问题。

参考文献

[1]Edmondo Trentin, Marco Gori. A survey of hybrid ANN/HMM models for automatic speech recognition[J].Neurocomputing,2001,(37):91-126.

[2]王凯.免疫粒子群改进LBG的孤立词语音识别算法研究[J].数字技术与应用,2013,(1):111-113.

[3]夏妍妍,黄健,尹丽华.基于径向基函数神经网络的语音识别[J].大连海事大学学报,2007,(S1):157-159.

[4]孟艳,潘宏侠.PSO聚类和梯度算法结合的RBF神经网络优化[J].自动化仪表,2011,(02):6-8.

神经网络文本分类篇7

关键词:图像分类;深度学习;Caffe框架;卷积神经网络

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2016)35-0209-03

Research and Implementation of Image Classification Based on Convolution Neural Network

WANG Chao

(Information Engineering Institute,East China University of Technology, Nanchang 330013, China)

Abstract: The problem of image classification has been the core problem in computer vision. A good solution is developed by further study which can solve the problem of extracting image features in image classification. In order to learn image features efficiently, constructing the machine learning model with hidden layer as well as training a large number of image data will eventually promote the accuracy of image classification or prediction. This paper is intended as an in-depth Caffe learning framework to construct a small image data-base. The convolutional neural network provided by Caffe framework will make a training analysis of the data set and then extract the information of target image features. These can be used for the final prediction of the target image. Compared with the traditional image classification algorithm, the accuracy of the prediction will be greatly improved.

Key words: image classification; deep learning; Caffe framework; Convolutional Neural Network

S着计算机与互联网技术的快速发展,我们已经进入了一个以图像构建的世界。但是面临有海量图像信息却找不到所需要的数据的困境,因而图像分类技术应运而生。通过各种机器学习算法使计算机自动将各类图像进行有效管理和分类,但是由于图像内容包含着大量复杂且难以描述的信息,图像特征提取和相识度匹配技术也存在一定的难题,要使得计算机能够像人类一样进行分类还是有很大的困难。

深度学习是近十年来人工智能领域取得的重要突破,在图像识别中的应用取得了巨大的进步,传统的机器学习模型属于神经网络模型,神经网络有大量的参数,经常会出现过拟合问题,因而对目标检测准确率上比较低。本文采用卷积神经网络框架,图像特征是从大数据中自动学习得到,而且神经网络的结构深由很多层组成,通过重复利用中间层的计算单元来减少参数,在特征汇聚阶段引入图像中目标的显著信信息,增强了图像的特征表达能力。通过在图像层次稀疏表示中引入图像显著信息,加强了图像特征的语义信息,得到图像显著特征表示,通过实验测试,效果比传统的图像分类算法预测的准确度有明显的提升。

1 基于卷积神经网络的图像分类方法

1.1 人工神经网络

人工神经网络(Artificial Neural Network, ANN)是描述生物神经网络运行机理和工作过程的抽象和简化了的数学物理模型,使用路径权值的有向图来表示模型中的人工神经元节点和神经元之间的连接关系,之后通过硬件或软件程序实现上述有向图的运行[1]。目前最典型的人工神经网络算法包括:目前最典型的人工神经网络有BP网络 [2]Hopfield网络[3]Boltzmann机[4]SOFM网络[5]以及ART网络人工神经网络[6],算法流程图如图1所示[7]。

1.2 卷积神经网络框架的架构

Caffe是Convolutional Architecture for Fast Feature Embedding的缩写[8],意为快速特征嵌入的卷积结构,包含最先进的深度学习算法以及一系列的参考模型,图2表示的是卷积神经网络结构图。Caffe深度学习框架主要依赖CUDA,IntelMKL,OpenCV,glog软件以及caffe文件。本文使用的各个软件版本说明,如表1所示。

Caffe深度学习框架提供了多个经典的卷积神经网络模型,卷积神经网络是一种多层的监督学习神经网络,利用隐含层的卷积层和池采样层是实现卷积神经网络特征提取功能,卷积神经网络模型通过采取梯度下降法最小化损失函数对网络中的权重参数逐层反向调节,通过频繁的迭代训练来提高网络的精度。卷积神经网络使用权值共享,这一结构类似于生物神经网络,从而使网络的复杂程度明显降低,并且权值的数量也有大幅度的减少,本文使用这些模型直接进行训练,和传统的图像分类算法对比,性能有很大的提升,框架系统训练识别基本流程如图3表示。

1.3 图像分类特征提取

卷积神经网络的结构层次相比传统的浅层的神经网络来说,要复杂得多,每两层的神经元使用了局部连接的方式进行连接、神经元共享连接权重以及时间或空间上使用降采样充分利用数据本身的特征,因此决定了卷积神经网络与传统神经网络相比维度大幅度降低,从而降低计算时间的复杂度。卷积神经网络主要分为两个过程,分为卷积和采样,分别的对上层数据进行提取抽象和对数据进行降维的作用。

本文以Caffe深度学习框架中的 CIFAR-10数据集的猫的网络模型为例,如图4所示,对卷积神经网络模型进行训练。CIFAR-10是一个标准图像图像训练集,由六万张图像组成,共有10类(分为飞机,小汽车,鸟,猫,鹿,狗,青蛙,马,船,卡车),每个图片都是32×32像素的RGB彩色图像。通过对数据进行提取和降维的方法来提取图像数据的特征。

2 实验分析

将猫的图像训练集放在train的文件夹下,并统一修改成256×256像素大小,并对猫的图像训练集进行标记,标签为1,运行选择cpu进行训练,每进行10次迭代进行一次测试,测试间隔为10次,初始化学习率为0.001,每20次迭代显示一次信息,最大迭代次数为200次,网络训练的动量为0.9,权重衰退为0.0005,5000次进行一次当前状态的记录,记录显示如下图5所示,预测的准度在98%以上。而相比传统的图像分类算法BP神经网络网络的收敛性慢,训练时间长的,网络的学习和记忆具有不稳定性,因而卷e神经网络框架在训练时间和预测准度上具有非常大的优势。

3 结束语

本文使用Caffe深度学习框架,以CIFAR-10数据集中猫的网络模型为例,构建小型猫的数据集,提取猫的图象特征信息,最后和目标猫图像进行预测,并和传统的图像分类算法进行对比,预测的准确率有很大的提升。

参考文献:

[1] 杨铮, 吴陈沭, 刘云浩. 位置计算: 无线网络定位与可定位性[M]. 北京: 清华大学出版社, 2014.

[2] 丁士折. 人工神经网络基础[M]. 哈尔滨: 哈尔滨工程大学出版社, 2008.

[3] McClelland J L, Rumelhart D E, PDP Research Group. Parallel distributedprocessing[J]. Explorations in the microstructure of cognition, 1986, 2.

[4] Hopfield J J. Neural networks and physical systems with emergent collectivecomputational abilities[J]. Proceedings of the national academy of sciences, 1982, 79(8): 2554-2558.

[5] Ackley D H, Hinton G E, Sejnowski T J. A learning algorithm for boltzmannmachines[J]. Cognitive science, 1985, 9(1): 147-169.

[6] Kohonenmaps T. Self-Organized Formation of Topologically Correct Feature Maps[J]. Biological Cybernetics,1982, 43(1): 59-69.

神经网络文本分类篇8

关键词:乳腺癌;神经网络;自动分类

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2013)33-7558-02

现代社会生活节奏的加快,女性患乳腺癌的几率也随之变大。乳腺癌已成为影响现代女性健康的一大杀手。根据中国抗癌协会公布的相关数据显示,近年来,我国乳腺癌的发病率正以每年3%的速度递增,发病人群呈现年轻化的趋势。乳腺癌已成为现代城市中死亡率增长最快的癌症 [1]。医生在采取治疗措施之前,必须能够快速的对乳腺癌的种类进行确定,这对治疗乳腺癌的有效治疗手段的选择至关重要。传统的有效分类方法是穿刺,但是此类方法往往耗时,通常需要3天左右,并且病人需要克服对穿刺的心理恐惧。因此应用机器进行快速学习分类的乳腺癌辅助诊断方法应运而生。

作为一种常用的机器自动分类方法基于人工神经网络模型的分类方法是基于仿生学理论来实现,在对人类大脑工作机制进行高度仿真的基础上,完成对网络的训练,使训练后的神经网络能够展现出人类大脑的功能,比如感知学习、逻辑推理等等。基于所采用的样本相似性,人工神经网络技术可以利用各种融合结构来完成网络权值的表述,具体步骤为:(1)、利用神经网络中的特定算法完成知识的获取,得到必须的不确定性推理机制;(2)、根据得到的推理机制完成融合过程,对网络权值进行修正,然后重新进行在学习,最后使输出的信号误差达到允许的范围之内。

在现有的多种神经网络模型中,该文采用基于误差反向传播理论的前馈网络算法(简称BP法)进行乳腺癌的自动分类。

1 BP神经网络系统的设计

1)样本的选取

本文采用由威斯康星大学医院威廉博士提供的699组乳腺癌数据,每组数据包括乳腺癌患者的9个特征参数,它们分别是:肿块密度、细胞的大小的一致性、细胞形状的一致性、边缘附着力、单上皮细胞大小、裸核、布兰德染色质、正常核仁、有丝分裂。这些患者中良性患者458人(65.5%),恶性患者241人 (34.5%)。随机选取500组作为网络训练样本,另外199组作为测试样本。

2)隐层数的设计

设计隐层数前,应对网络的训练样本及样本映射问题进行确认。根据乳腺癌数据,评价乳腺癌的特征参数有9个,故网络输入层点数为9。输出点数确定应以乳腺癌良性和恶性归类为依据。故可确定输出节点数为2。

在对多层前馈网络结构进行设计时,主要应考虑两大问题:一是,需要设计几个网络隐层;二是,针对所设置网络隐层,分别应设置几个隐节点,方可实现最佳。从理论角度进行分析,可以得知采用单隐层前馈神经网络能够映射所有连续函数,因此多采用单隐层前馈神经网络。而需要两个或两个以上的隐层的情况,一般是学习不连续函数[3]。在本项研究中,采用的是单隐层结构的神经网络。

3)隐节点数的设计

隐节点的设计主要用以提取和记忆学习样本数据的的内在规律。隐节点的数量一般是不确定的。每一个隐节点均有若干权值。而每一个权值均可以怎强网络映射能力。隐节点数确定对构造网络结构十分关键。隐节点数过多易出现出现过度吻合,减弱神经网络泛化能力,增加网络的训练时间等问题。例如网络对如噪音等非规律内容的记忆。隐节点过少易出现不能有效的概括和体现样本数据,获取信息能力相对较差。

在确定隐层节点个数时,主要应考虑三大决定因素,一是,样本噪声的大小;二是,提供给训练网络的样本数目;三是,样本数据中蕴含规律的复杂程度。在对最佳隐层节点个数进行确定时,我们较为常用的方法是试凑法。即,在样本集相同的前提下,由少到多的逐步增加,分别进行训练,以最终得出的训练结果来确定误差最小时的隐节点数。该文中我们采用了确定隐节点数的经验公式[m=n+l+a]进行估计,其中[m]表示隐层节点数,[n]表示输入层节点数,[l]为输出节点数。[α]为1~10之间的常数[3-4]。因此根据本文中输入节点数为9,输出节点数为2,我们选择隐层数分别为5、6、7、8、9、10、11、12、13的网络进行训练和测试。

2 神经网络设置

经过反复训练和测试,用于乳腺癌的自动分类的BP神经网络,选取的网络参数如表1所示。根据网络参数,该文采用的BP神经网络模型如图1所示。

表1 网络参数选取结果

[参数名称\&参数值\&参数名称\&参数值\&输入节点个数\&9\&最小均方误差\&1e-2\&输出节点个数\&2\&隐层节点个数\&5-13\&最小梯度\&1e-20\&隐层转移函数\&Logsig\&输出层转移函数\&Purelin\&最大训练步数\&1000\&]

3 仿真实验

为BP算法的可行性进行验证,本项研究引入Matlab神经网络工具箱作为变成工具,实现对乳腺癌的自动分类。

图2给出了神经网络训练过程,从图中可看出,经20步训练后,达到表1设定的允许误差范围。

(上方线为训练误差曲线,下方线为目标误差)

4 实验测试效果及评价

改变隐层节点数,对训练好的网络进行样本测试,测试结果如表2所示。199组测试数据中,识别正确率均在98%以上,识别效果较好。经过反复训练,隐层节点数设置为12时,分类效果最佳。同时也说明BP神经网络模型适合于乳腺癌的分类。

5 结束语

本文设计了不同BP神经网络模型参数对乳腺癌进行自动分类实验,通过调节不同隐层节点数,得到最佳网络参数设置,识别率较高。该方法可以针对乳腺癌的诊断,为医生提供辅助判别参考,能有效提高医生的工作效率。

参考文献:

[1] 章永来,史海波,尚文利,等.面向乳腺癌辅助诊断的改进支持矢量机方法[J].计算机应用研究,2013,8(30):2374-2376.

[2] 姜力,刘宏,蔡鹤皋,等.基于神经网络的多维力传感器静态解偶的研究[J].中国机械工程,2002,13(24):2100-2102.

推荐期刊