线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

设备事故分类8篇

时间:2022-10-01 22:07:02

设备事故分类

设备事故分类篇1

关键词:设备故障;管理;概念;分类;管理程序;类别;性质;分析及处理

中图分类号:C93

文献标识码:A

文章编号:1672-3198(2010)17-0377-02

1 设备故障的概念

在《设备管理维修术语》一书中,将故障定义为“设备丧失规定的功能”。这一概念可包括如下内容:

(1)引起系统立即丧失其功能的破坏故障。

(2)与设备性能降低有关的性能上的故障。

(3)即使设备当时正在生产规定的产品,而当操作者无意或蓄意使设备脱离正常的运转时。

事故也是一种故障,是侧重安全与费用上的考虑而建立的术语,通常是指设备失去了安全的状态或设备受到非正常损坏等。故障这一术语,在实际使用时常异常、事故等词语混淆。对故障来说,必须明确对象设备应该保持的规定性能是什么,以及规定的性能现在达到什么程度,否则,就不能明确故障的具体内容。假如某对象设备的状态和所规定的性能范围不同,则认为该设备的异常即为故障。反之,假如,对象设备的状态,在规定性能的许可水平以内,此时,即使出现异常现象,也还不能算作是故障。总之,设备管理人员必须把设备的正常状态、规定性能范围,明确地制订出来。只有这样,才能明确异常和故障现象之间的相互关系,从而,明确什么是异常,什么是故障。

2 设备故障管理的重要性

设备故障的产生,受多种因素的影响,如设计制造的质量,安装调试水平,使用的环境条件,维护保养,操作人员的素质,以及设备的老化、腐蚀和磨损等。为了减少甚至消灭故障,必须了解、研究故障发生的宏观规律,分析故障形成的微观机理,采取有效的措施和方法,控制故障的发生,这就是设备的故障管理。故障管理,特别是对生产效率极高的大型连续自动化设备的故障管理,在管理工作中,占有非常重要的地位。

高度现代化的设备的特点是高速、大型、连续、自动化。面对生产率极高的设备,故障停机会带来很大的损失。在大批量生产的机械流程工厂,防止故障、减少故障停机次数、保持生产均衡是非常重要的。它不仅能减少维修工作的人力、物力费用和时间,更重要的是保持较高的生产率,创造出每小时几万甚至几十万产值的经济效益。对石化、石油、冶金等流程工业,设备的局部异常会导致整机停转或整个自动生产线停产,甚至由局部的机械、电气故障或泄漏导致重大事故的发生,以致污染环境,破坏生态平衡,造成不可挽回的损失。因此,随着设备现代化水平的提高,加强设备故障管理,防止故障的发生,保持设备高效的正常运转,有着重要的意义。

3 设备故障的分类

设备故障按技术性原因,可分为四大类,即:

(1)磨损性故障:由于运动部件磨损,在某一时刻超过极限值所引起的故障。所谓磨损是指机械在工作过程中,相互接触做相互运动的对偶表面,在摩擦作用下发生尺寸、形状和表面质量变化的现象。

(2)腐蚀性故障:按腐蚀机理又分化学腐蚀、电化学腐蚀和物理腐蚀三类。

(3)断裂性故障:可分为脆性断裂、疲劳断裂、应力腐蚀断裂、塑性断裂等。

(4)老化性故障:上述综合因素作用于设备,使其性能老化所引起的故障。

4 设备故障管理的程序

设备故障管理的目的是在故障发生前通过设备状态的监测与诊断,掌握设备有无劣化情况,以期发现故障的征兆和隐患,及时进行预防维修,以控制故障的发生;在故障发生后,及时分析原因,研究对策,采取措施排除故障或改善设备,以防止故障的再发生。要做好设备故障管理,必须认真掌握发生故障的原因,积累常发故障和典型故障资料和数据,开展故障分析,重视故障规律和故障机理的研究,加强日常维护、检查和预修。这样就可避免突发性故障和控制渐发性故障。

设备故障管理的程序如下:

(1)做好宣传教育工作,使操作工人和维修工人自觉地遵守有关操作、维护、检查等规章制度,正确使用和精心维护设备,对设备故障进行认真地记录、统计、分析。

(2)结合本企业生产实际和设备状况及特点,确定设备故障管理的重点。

(3)完善故障记录制度。故障记录是实现故障管理的基础资料,又是进行故障分析、处理的原始依据。记录必须完整正确。

(4)及时进行故障的统计与分析。车间设备机械员(技师)、动力员除日常掌握故障情况外,应按月汇集“故障修理单”和维修记录。通过对故障数据的统计、整理、分析、计算出各类设备的故障频率、平均故障间隔期,分析单台设备的故障动态和重点故障原因,找出故障的发生规律,以便突出重点采取对策,将故障信息整理分析资料反馈到计划部门,以便安排预防修理或改善措施计划,还可以作为修改定期检查、检查内容和标准的依据。

(5)针对故障原因、故障类型及设备特点的不同采取不同对策。对新购置的设备应加强使用初期管理,注意观察、掌握设备的精度、性能与缺陷,做好原始记录。

(6)做好控制故障的日常维修工作。通过区域维修工人的日常巡回检查和按计划进行的设备状态检查所取得的状态信息和故障征兆,以及有关记录、分析资料,由车间设备机械员或修理组长针对各类型设备的特点和已发现的一般缺陷,及时安排日常维修,便于利用生产间隙时间或周末,做到预防在前,以控制和减少故障发生。

(7)建立故障信息管理流程图。

5 设备事故类别与性质

5.1 设备事故类别确定

设备因非正常损坏造成停产或效能降低,停机时间和经济损失超过规定限额的称为设备事故。设备事故分类标准由国务院工业交通各部门确定,《全民所有制工业交通企业设备管理条例》第三十二规定,设备事故分为一般事故、重大事故和特大事故三类:

(1)一般事故。修复费用一般设备500-1万元;精、大、稀及机械工业关键设备1000-30000者;或因设备事故造成全厂供电中断10-30Min为一般事故。

(2)重大事故。修复费用一般设备达10000元以上,机械工业关键设备及精、大、稀设备达30000元以上者;或因设备事故而使全厂电力供应中断30min以上为重大事故。

(3)特大事故。修复费用达50万元以上,或由于设备事故造成全厂停产2天以上,车间停产一周以上为特大事故。

5.2 设备事故性质确定

设备事故按其发生可分为以下三类:

(1)责任事故。凡属于人为原因,如违反操作维护规程、擅离工作岗位、超负荷运转、加工工艺不合理以及维护修理不良等,致使设备损坏停产或效能降低,称为责任事故。

(2)质量事故。凡因设备原设计、制造、安装等原因,致使设备损坏停产或效能降低,称为质量事故。

(3)自然事故。凡因遭受自然灾害,致使设备损坏停产或效能降低,称为自然事故。

6 如何对设备事故进行分析及处理

6.1 设备事故分析

设备发生事故后,要立即切断电源,保持现场,采取应急措施,防止损失扩大。按设备分级管理的有关规定上报,并及时组织有关人员根据“三不放过”的原则(设备事故原因分析不清不放过、设备事故责任者与群众未受到教育不放过、没有防范措施不放过),进行调查分析,严肃处理,从中吸取经验教训。必要时还可组织设备事故调查组,吸收相近专业的技术人员参加,分析设备事故原因,制订防范措施,提出处理意见。

具体应做好以下几点:

(1)要重视并及时进行分析。分析工作进行得越早、原始数据越多,分析设备事故原因和提出防范措施的根据就越充分,要保存好分析的原始数据。

(2)认真做好设备事故的抢修工作,把损失控制在最小程度。

(3)做好设备事故的上报工作。

(4)认真做好设备事故的原始记录。

6.2 设备事故处理

国务院的《全民所有制工业交通企业设备管理条例》第三十八条规定“对,违章指挥,违反设备操作、使用、维护、检修规程,造成设备事故和经济损失的职工,由其所在单位根据情节轻重,分别追究经济责任和行政责任;构成犯罪的,由司法机关依法追究刑事责任”。

设备事故发生后:

(1)必须遵循“三不放过”原则进行处理,任何设备事故都要查清原因和责任,对事故责任者按情节轻重、责任大小、认错态度分别给予批评教育、行政处分或经济处罚,触犯刑律的要依法制裁,并制订防范措施。

设备事故分类篇2

abstract: equipment fault rate puts influence on equipment. applying statistics analysis methods, the paper tries to find affecting unfavorabale factor of epuipment operation, regularity and trendency of equipment accident, and control unfavorabale factor, for improving equipment operation rate.

关键词: 统计分析;设备事故趋势;降低故障

key words: statistics analysis;trendency of equipment accident;reduce equipment fault rate

中图分类号:tu713 文献标识码:a 文章编号:1006-4311(2013)20-0063-02

0 引言

鞍钢集团矿业公司下属的一家企业。运用事故统计分析方法,针对2010年所发生的事故,从事故发生的类型、事故类别、时间等方面进行研究,基本发现了该厂的设备事故发生的规律及趋势。2011年根据该研究成果,提出改进技术措施及设备管理办法,减少了事故的发生。

1 统计分析方法在设备管理中的应用

1.1 设备事故统计分析定义 所谓的设备事故统计分析是运用统计学研究设备事故发生规律的方法。它通过对大量的设备事故统计资料、数据进行加工、整理和综合分析,揭示设备事故发生的规律及分布特征。科学准确的统计分析结果能够为观察事故发生趋势、探查事故发生原因、制定事故预防措施、预测未来事故等提供依据。

1.2 设备事故统计分析的基本方法 事故统计分析方法包括:综合分析法、统计分析和统计图表等三种。

2 2010年设备事故发生趋势分析

表1是2010年设备事故统计表,从中可以看出,2010年共发生设备事故177次,平均每月发生15次;造成主体作业区设备停机845.3小时,影响铁精矿产量8万吨,烧结矿产量10万吨,造成经济损失5400万元。

2.1 事故类型分析 从图1可以看出,在177次设备事故中:设备故障132次,一般事故27次,较大事故8次,重大事故10次。其中设备故障发生频率较高,占到了设备事故的74.57%。主要原因是:(1)由于设备老化。(2)设备维护不到位。

2.2 事故专业类别分析 从图2可以看出,机械事故93次,电气事故77次,生产事故7次,其中:机械和电气设备事故发生较高,分别占52.54%和43.5%。

2.3 设备事故季节性分析 从图3可以看出,5、6、7月份事故率较高。主要是因为:这个季节温度较高,同时也是生产的黄金季节,生产量排产较高,为了保证生产任务的完成,需要设备长时间运转,这样就加大了设备隐患,使设备事故频繁发生。

3 设备事故管理改进措施

针对2010年设备事故发生频繁,故障率较高,在2011年提出改进技术措施及设备管理办法,从设备前期预防管理、设备点检定修管理入手,建立动态设备宏观管理体系,保证设备正常运转及提高设备作业率。①建立健全设备事故管理制度;②建立事故预案对策;③建立设备事故上报及分析制度;④设备事故预报、预警与精密点检相结合。

4 结束语

从表3中可以看出,由于设备管理的加强,使设备技术状况全面得到升级,2011年设备事故发生次数明显减少,仅有43次;设备故障停机时间由845.3小时减少到359小时,经济损失由2010年的5400万元降低至600万元。

4.1 设备事故统计表

4.2 事故类型与事故类别对比分析

从图4中可以看出,2011年设备事故共发生43起,比2010年177起减少了134起,事故次数减少了75.7%。其中:设备故障减少116起,故障次数减少了87.88%,一般事故减少12起,一般事故次数减少了44.44%,较大事故减少2起,较大事故次数减少了25%,重大事故减少4起,重大事故次数减少了40%。

从图5中看出,2011年比2010年减少的134次事故中,机械原因减少了61次,电气原因减少了70次,生产原因减少了5次,其中机械原因和电气原因减少幅度比较大。在机械方面主要是加强岗位、专业点检,加强设备维护,对于老化设备定期进行更换。在电气方面主要是完善电机烧损原因分析制度和制定电机修理费考核制度。

4.3 事故按时间对比分析

结论: 从表4和图6中看出,故障率呈下降趋势,2011年故障率比

2010年下降了58.38%,由1.93%下降至0.82%。

参考文献:

[1]黄良文.统计学原理[m].中国统计出版社,2007,7.

设备事故分类篇3

关键词 安全生产标准化;设备设施;特种设备;管理

中图分类号:F426 文献标识码:A 文章编号:1671-7597(2013)20-0166-02

设备设施是电力企业生产运营中重要的因素。加强对设备设施的安全监督管理,预防设备设施事故,保障人身和财产安全,提高企业的经济效益,是设备设施管理的主题和中心任务,也是企业管理的重要对象。因此,如何高效、科学地管理设备设施,加强管理力度,具有重要的现实意义。

1 设备设施管理中存在的问题

在开展安全生产标准化工作之前,本公司的设备设施管理存在着以下问题。

1)设备设施技术资料、档案不齐全,管理混乱。

2)设备管理制度不健全、不完善,管理不到位。管理者、操作者职责不清晰,不明确。

3)陈旧设备老化,未能及时维修。

4)设备的保养、维修、自检记录不全。

5)操作人员无培训,无证上岗。

2 安全生产标准化工作

正因为我们的企业对设备设施的管理存在这样那样的问题,必然避免不了各种隐患的存在。为了消除生产中可能发生的安全隐患,提高我们企业安全生产水平,因此建立健全自我约束、持续改进的安全生产长效机制,开展安全生产标准化工作是目前最紧迫、最刻不容缓的工作。

安全生产标准化工作是通过组织建立企业安全生产责任制,制定规章制度和操作规程,安全隐患排查治理,辨识和监控重大危险源,建立预防机制,规范生产行为,使各生产环节符合安全生产法律法规和标准规范的要求,让我们的企业处于良好的生产状态,并持续改进,不断加强企业安全生产规范化建设。

3 设备设施的分类管理

为了实现安全生产标准化工作,达到标准化要求,有必要对我们企业的设备设施进行分类,实施管理。设备可以分为一般性设备、特种设备和重要设备三种类型。这里对后两种设备的管理展开研究。

3.1 特种设备管理及措施

3.1.1 特种设备的含义

涉及到生命安全、危险性较大的锅炉、压力容器(含气瓶,下同)、压力管道、电梯、起重机械、客运索道、大型游乐设施及厂内机动车辆,称之为特种设备。

在生产过程中,特种设备比一般性生产设备具有更大的潜在危险性,易发生事故造成操作者本人或他人的伤害,以及机械设备设施等重大的财产损失,有效监控特种设备的安全运行、规范特种作业人员的操作程序和基本素质要求,能预防重大事故的发生,确保安全生产。

3.1.2 安全措施

1)特种设备应执行注册登记制度,必须有法定检验机构出具的验收检验报告和安全检验合格标志,才可投入正式使用。

2)特种设备应建立安全技术档案。

安全技术档案包括特种设备的设计文件、制造单位、产品质量合格证明、使用维护说明等文件以及安装技术文件和资料。安全技术档案要备案,形成台账,施行分类管理。

3)从事特种设备的作业人员必须经过培训、考核,合格后取得特种设备作业人员证,才能从事相应的作业或者管理工作。

4)为保证特种设备正常运行必须进行定期和巡回检测检验,以避免设备事故的发生,保障生产安全和生命安全。

5)所有的定期检验都应有法定检验机构出具的检验报告,安全检验标志超过有效期的特种设备不得使用。

3.2 重要设备管理及措施

3.2.1 重要设备等级划分

把公司现阶段的设备设施汇总,筛选出现价值在2万元以上的设备设施,称为重要设备,加以分类管理。

按照《国家电网公司安全事故等级说明》划分成6个安全事故等级,6个等级按事故严重程度从高到低分别为:

1)国家安全事故等级四级。

国家安全事故等级四级(一般事故)的设备,是造成100万元以上1000万元以下直接经济损失者。

2)国网安全事故等级五级。

国网安全事故等级五级的设备,是造成50万元以上100万元以下直接经济损失者。

3)国网安全事故等级六级。

国网安全事故等级六级的设备,是造成20万元以上50万元以下直接经济损失者。

4)国网安全事故等级七级。

国网安全事故等级七级的设备,是造成10万元以上20万元以下直接经济损失者。

5)国网安全事故等级八级。

国网安全事故等级八级的设备,是造成5万元以上10万元以下直接经济损失者。

6)公司安全事故等级九级(公司自定义)。

公司安全事故等级九级的设备,是本公司自定义级安全事故等级,是指造成2万元以上5万元以下直接经济损失者。

3.2.2 重要设备管理等级划分

把属于安全事故等级四级的设备,归为第一类重要设备管理;把属于国网安全事故等级五级和安全事故等级六级的设备,归为第二类重要设备管理;把属于国网安全事故等级七级、八级和公司安全事故等级九级的设备,归为第三类重要设备管理。

其中的特种设备在原有的等级中上调一级进行管理。把没有归纳到这6个安全事故等级的特种设备,一同并入第三类重要管理设备中,统一管理。这些特种设备的管理要遵循特种设备安全管理的同时,也必须遵循三类重要设备的安全管理。

这样,第一类设备的数量是最少的,第三类设备的数量是最多的。这样的划分,这三类设备数量的总和占全公司设备总数的20%,而总金额占全公司设备总金额的75%,实现了管理全公司价值和重要性最大的这部分设备,同时也节约管理成本,提高了管理效率。

3.2.3 安全措施

三类设备管理按照设备的重要程度和危险性,分别从设备采购、设备档案、定期检查、现场要求四个方面做了不同要求的分类管理。比如一类设备因为价值大,对生产活动影响也大,所以对其管理要严格,要求设备档案齐全、及时备案;检查第一类设备的频率要多于第二类、第三类设备;操作人员要参加岗前培训,持证上岗;现场要求贴有设备标识卡,张贴安全操作规程、警示牌等措施。

第二类设备、第三类设备相对价值略低点,管理的要求相对第一类设备要低些,检查的频率也少些,但是第二类设备、第三类设备中有特殊要求的设备(如特种设备)要严格按照该设备的要求执行。

4 结束语

怎样把设备设施的管理做好做精,是一个复杂的综合性课题,需要领导、各级管理人员、设备操作人员、维修人员之间相互配合、责任明确,保持居安思危的忧患意识,真正做到“安全第一、预防为主”,这样才能有效地消除设备运行过程中的不安全因素,确保公司设备设施财产和人身安全,防止和杜绝安全事故的发生。

参考文献

[1]中国安全生产协会注册安全工程师工作委员会,中国安全生产科学研究院.安全生产管理知识.中国大百科全书出版社.

设备事故分类篇4

【关键词】危险因素 因果图 分析

1施工危险因素的因果图分类法

因果图早先是用以表示质量特性与有关质量因素之间的因果关系。本文利用因果图来确定危险因素与施工安全事故之间的因果关系,进而对施工危险因素进行归纳分类和识别分析。

1.1 因果图分析方法

因果图,又称特性因素图,因形状像鱼刺,有人称他为鱼刺图,该图由日本质量管理专家石川馨于1943年提出,也称为石川图。

安全事故因果图由施工安全事故和危险因素两部分组成,如图1-1所示。图中主干箭头所指的为安全事故,主干上的大枝表示危险因素类别,中枝、小枝、细枝表示危险因素的依次展开。

因果图的作图步骤及方法如下:

第一步:确定待分析的安全事故,画主干箭杆、箭头,箭头向右,将安全事故写在箭头右侧的方框内。

第二步:确定安全事故中危险因素的分类方法,对不同类型的安全事故可按其影响因素(即:技术工艺因素(Method/ Technical)、材料因素(Material)、机械设备因素(Machine)、环境因素(Environment)、管理因素(Management)等)进行分类,。对每一类危险因素画出大枝,箭头方向从左到右倾斜指向主干并在箭头尾端写上危险因素分类项目。

第三步:将各分类项目分别展开,每个大枝上分出若干中枝表示各项目中造成安全事故的一个因素,中枝平行于主杆箭头,指向大枝。

第四步:将中枝进一步展开成小枝,小枝进一步展开成细枝的因素,依次展开,直细到能采取具体控制措施为止。

1.2 施工危险因素因果图分类分析

根据事故成因分析可知,施工安全事故是结果,各种危险因素是导致事故发生的原因。根据上述因果图的作图步骤方法,做出施工危险因素与施工安全事故的因果分析图,如图1-2所示,主箭头右端施工安全事故是指施工过程可能发生的所有安全事故,主箭杆上的大枝箭杆的尾部所标注的危险因素是指危险因素的类别,中枝、小枝、细枝所标注的危险因素是指引发事故的具体原因,这些危险因素的细分程度以能够采取具体的控制措施为标准。

由图1-2可以看出,造成安全事故的危险因素不外乎如下几种:技术工艺因素(Method/Technical)、材料因素(Material)、机械设备因素(Machine)、环境因素(Environment)、管理因素(Management),每种危险因素都包含一定数量的具体危险因素。不同事故类型的具体危险因素在不同施工阶段表现的形式和内容是有所不同的。

2施工过程的五类施工危险因素

为便于建筑工程施工安全事故危险因素分析研究,结合建筑工程施工安全管理的特点,根据图1-2的因果分析,我们把建筑工程项目施工过程的施工危险因素分成五类。

2.1技术工艺因素

技术工艺因素主要是指建筑工程在施工准备阶段所进行的施工组织设计中采用的各种专项施工方案、安全施工方案、安全技术标准等。在施工过程中采用的工艺标准是否成熟,是否存在安全隐患等等。

2.2材料因素

材料因素是指施工过程中采用的物质材料是否符合国家相关质量安全标准,安全材料的投入是否到位。

2.3机械设备因素

机械设备因素是指施工机械、设备在施工过程中是否处于完好正常运转状态,机械设备是否存在故障、机械设备的安全性能是否满足安全施工的要求。

2.4环境因素

环境因素就是指工程项目所在地的地质、地形、气象条件、周围环境以及施工现场布置是否合理、安全、整洁、有序,是否存在安全隐患。

2.5管理因素

管理因素与前四种因素是紧密相连的,在技术工艺因素、材料因素、机械设备因素、环境因素中都包含一定数量的危险因素,这些危险因素所处的状态和具有的危险性都与管理因素有直接或间接的关系。在管理因素中使前四种危险因素产生危险作用引发安全事故的因素就是管理方面的危险因素。

3基础施工阶段危险因素识别分析

基础施工阶段是工程实体施工的开始,各种危险因素开始逐步增多。根据本阶段要完成的分项工程,结合有关安全事故的统计资料分析,基础施工阶段可能发生的安全事故类型主要有:(1)施工坍塌事故;(2)物体打击事故;(3)起重伤害;(4)触电事故;(5)机械(具)伤害事故。

4主体施工阶段危险因素识别分析

主体施工阶段可能发生的安全事故最多,几乎所有事故类型都可能发生,但经常发生的也就是前面讨论过的六类:(1)高处坠落事故;(2)施工坍塌事故;(3)物体打击事故;(4)起重伤害;(5)触电事故;(6)机械(具)伤害事故。以高处坠落事故因果图分析为例,主体施工阶段引发高处坠落事故的具体危险因素有:(1)技术工艺因素有:高空作业防护方案存在安全缺陷、技术交底缺少安全内容或安全技术交底不全面、采用的施工技术工艺标准本身不符合安全要求;(2)材料因素有:脚手扳不符合安全质量要求造成施工过程中断裂发生坠落事故、脚手板有空隙、探头板、简易架子折断坍塌造成坠落,安全网、安全带不合格造成坠落;(3)机械设备因素有:垂直运输设备制动失灵造成坠落、机械设备操作失误发生坠落、机械设备碰撞;(4)环境因素有:雨雪天湿滑造成坠落、强风造成坠落、高温引起的中暑头晕或严寒引起的手脚不灵发生坠落;(5)管理因素有:高空作业未编制安全防护方案或方案未经审批、未做安全技术交底或交底不到位、洞口、楼梯口、电梯口、天井口和坑口无防护、楼面、屋顶、高台边缘无防护、无安全检查或检查不彻底。

5装饰安装阶段危险因素识别分析

装饰安装阶段是工程施工的收尾完工阶段,经过前二个阶段的施工,各种施工方案和安全措施已得到有效的检验,除临时用电外,继续延用的技术方案和安全措施,只要管理措施到位,一般不会产生新的危险因素。能够产生新的危险因素的相关因素有:新的技术方案(如:装饰安装没有施工方案、脚手架拆除没有方案)、新的材料等,该阶段可能会发生的安全事故有:(1)高处坠落事故;(2)物体打击事故;(3)起重伤害;(4)触电事故;(5)机械(具)伤害事故、以触电事故为例进行因果图分析,造成触电事故的危险因素有:技术工艺因素:线路不合理、装饰安装阶段中临时用电方案设计、未设接地保护和漏电保护;材料因素:用电线路绝缘老化、漏电保护失效;机械设备因素:机械损伤带电体绝缘部分、设备本身电路故障漏电;环境因素:绝缘体上导电粉尘过多、周围有强磁场造成设备自身带电、雨雪天潮湿漏电;管理因素:无安全用电培训、无安全技术交底、缺乏安全检查,无安全防护措施。

参考文献:

[1]苏振民.建筑施工现场管理手册.中国建材工业出版社,1999.

[2]中国建设监理协会编.建设工程质量控制.中国建筑工业出版社.

设备事故分类篇5

通过对故障类型和影响分析法进行详细介绍,结合实例进行了对象系统分解、故障类型分析、故障原因分析、故障影响分析、故障检测和控制措施分析等内容的论证,为运用系统安全分析方法开展设备安全管理作进一步探讨。

关键词:

故障类型;影响分析;安全管理;逻辑方框图

0前言

设备安全管理是企业安全生产工作的一项重要内容,许多事故的发生往往与设备故障因素分不开,如何加强设备的监测、监控与管理,保障设备运行安全,系统安全分析为人们提供了有效的途径。故障类型和影响分析法(FailureModeEffectsAnalysis,简称FMEA)是系统安全分析的重要方法之一,主要用于系统或设备的可靠性、安全性分析。长期以来,FMEA等系统安全分析方法大多作为高等院校安全管理专业的教材内容来选用,也有一些安全管理研究机构在作安全评价、专题研究时使用,而在企业日常管理工作中的应用却十分有限。因此,有必要对FMEA这一系统安全分析方法作详细介绍,以促进该方法在企业设备安全管理实践中的有效应用。

1FMEA介绍

故障类型和影响分析法,最早(1957年)在美国用机发动机故障的分析,因为实用而且便于掌握,后在电子、机械、电气系统等领域得到了推广和应用。FMEA采用系统分割的方法,将系统分解为子系统和元素,再逐个分析各种元素潜在的故障及其类型、推定引起故障的原因、查明各类故障对系统运行产生的影响,制定措施消除故障和控制风险的产生[1]。FMEA是一种归纳的系统安全分析方法,不与危险度结合时,只能应用于定性分析[2][3]。FMEA是一项技术性较强的工作,是系统安全理论与设备管理实践有机结合的又一新的重要形式,它需要设备管理、生产技术、安全监察等工程技术人员与生产一线员工的密切配合。同时,需要大家在分析过程中,认真查阅设备的使用说明书、设备安全技术操作规程、检修规程、设备运行记录、设备事故情况等资料,详细了解设备的构造、功能、关键部件、运行和检修中出现的故障类型,以及相关原因、故障带来的影响,掌握日常检测维护管理等方面的知识,为熟练应用FMEA,提高分析质量和效果等奠定基础。

2FMEA分析

FMEA的分析程序主要有系统分解、确定分析对象、故障类型分析、故障原因分析、故障影响分析、故障检测和控制措施分析等,每一步都环环相扣,步步递进,一层深入一层,逻辑关系十分严谨。

2.1对象系统分解

2.1.1分析步骤

(1)FMEA分析的第一步是确定对象系统,这是开展FMEA分析最基础的一步。如果将一座工厂作为对象系统时,应分析组成工厂的各个生产系统的故障类型及其影响;如果把某个生产系统作为对象系统时,应分析构成该系统的设备的故障类型及其影响。对于复杂的设备可以将构成设备的某一系统作为对象系统再进行分解,对于简单的设备,可以直接将设备作为对象系统进行分解。(2)确定了对象系统后,应根据需要确定分析的详细程度和分解的等级,按设备的构成和功能,将系统分解成子系统。然后再把子系统分解成总成、部件和零件,形成系统———子系统——系列——元素的顺序分组,画出逻辑方框图,即功能分组图或系统图。逻辑方框图是表示系统组成部分之间关系的一种图示,目的是全面和系统地分析设备关键部件功能丧失带来的影响,分析时需从系统的最高一级出发,按层级关系依次分解到系统的最下一级,最后分析出设备的关键部件。通过绘制逻辑方框图,使对象系统的组成、相互关系、层次更加明晰,避免在故障类型分析时出现不必要的遗漏。

2.1.2确定分析程度

(1)根据分析的需要和对象系统的复杂程度,来合理确定分解的详细程度。如果分析程度太浅,可能会漏掉重要的故障类型,如果分析程度太深,不加取舍地分析到所有的零部件,又会造成后续分析十分繁琐和复杂,重点不突出,影响控制措施的采用。所以,一般来讲,对关键的子系统可以分析得深一些,对不重要的子系统可以分析得浅一些,对影响微弱或无实际意义的子系统可以作忽略处理。(2)设置逻辑方框图。可以企业里使用比较广泛的设备为例,设置逻辑方框图。例如,电动葫芦作为起重设备的一类,广泛应用于企业的检修、安装等作业中,且在作业中发生事故的风险较高,故以电动葫芦为例进行FMEA分析。

2.2故障类型分析

通过逻辑方框图确定了故障类型分析的对象--元素,接下来就要分析系统元素(关键部件)的故障类型和产生原因。故障是指元件、子系统或系统在规定的条件下和运行时间内,达不到设计规定的功能要求,故障类型是故障呈现的状态或表现形式。故障不一定都会引起事故,但事故一定与故障因素有关。因此在开展故障类型分析时,要根据过去的运行经验、设备出现的故障或发生的事故情况,找出元素所有已出现过或可能出现的故障类型,包括设备试验时的故障。由于设备的功能和构造的复杂程度不同,分析的详细程度不同,元素的故障表现形式亦不同。一般情况下,一个元素的故障类型至少会有意外运行、不能按时运行、不能按时停止、运行中故障等4种可能。系统或设备发生故障的机理较为复杂,故障的表现形式亦多种多样,所以,故障类型的分析要尽可能全面与准确,能从繁杂的故障类型中筛选出对系统有影响的故障类型,避免遗漏。如果对一些关键故障类型的一时疏忽,可能就会造成无法弥补的损失。

2.3故障原因分析

元素的故障是故障原因对元素功能影响的结果,所以,在故障类型分析清楚后,要进行逆向追溯,对产生故障的原因展开详细分析,找出导致每一种故障的各种可能原因,为后续的影响后果、故障等级及措施分析奠定基础。故障原因分析要深入挖掘出直接原因,可以从设备的日常运行、操作、维护、检修、管理、使用环境,以至设计、制造、工艺、功能、材料、质量等各环节、多方面进行分析查找。故障类型和故障原因分析是FMEA分析的一个重点环节,故障类型和故障原因分析清楚后,将所有元素的所有故障类型进行归纳整理,形成故障类型表,也可以将故障产生原因一并列入表中,形成故障类型及原因推定表,故障表现与产生原因互相对照,使分析的思路更加清晰、直观,便于作进一步的排查分析。以故障类型及原因推定表举例说明。

2.4故障影响分析

故障影响分析是FMEA分析的重要内容和关键环节,它是在元素故障类型分析和故障原因分析的基础上进行的更深入一层的分析,也是在假设其他元素都正常运行或处于可以正常运行状态的前提下,系统、全面地研究和评价一个元素的每种故障类型对系统的影响,分别从该元素故障类型对整个系统、邻近系统、相邻元素、周围环境等方面的影响来进行分析。通过评价系统主要参数及其变化、故障后果,来确定故障类型对系统功能的影响,不同类型的故障对系统的影响不同。通过分析,找出故障类型对系统的影响,将分析结果进行汇总,编制故障类型和影响分析一览表,。对可能造成人员伤亡或重大财产损失的故障类型尽可能作故障类型、影响及致命度分析(FMECA),通过与定量分析相结合,以进一步确定元素发生故障时会造成致命度影响的概率。

2.5故障检测和控制措施

只有清楚了元素的全部故障类型及其影响,才能采取有针对性的防控措施,以防止故障的出现或避免事故的发生。FMEA作为一种系统安全分析方法,重要的是通过分析制定、实施对策,保障人员及设备设施的安全。所以,在完成了故障原因分析、故障影响分析后,尚需对每一个元素的故障形式制定合理的检测方法和科学有效的控制措施,这样才能形成一个完整的闭环,使FMEA的系统安全分析方法更好地指导生产实践,为保障设备设施安全运行发挥更好的作用。检测方法可以结合设备的日常运行维护来制定,包括日检、月检、季检、年检等检查周期和不同的检测手段、具体内容、参数要求等,具体情况可视不同的设备而定。控制措施的制定对保障设备安全十分重要,要与故障原因、故障影响相对应,要结合设备安全操作规程、设备检修规程等内容。基于风险可靠控制的要求,要真正做到有针对性和具有实际指导意义。如果控制措施的制定有漏洞,可能会直接导致故障的出现或事故的发生,使FMEA分析失去应有的意义。表格化是FMEA方法的特点之一,分析人员可根据相关内容设计出相应的表格来满足分析的需要。从对象系统确定开始,到故障类型分析、故障影响分析等均涉及到表格,不同阶段可通过不同的表格形式,将研究对象的相互关系进行归纳和整理,使分析内容更加系统、完善、清晰和直观,给分析和汇总工作带来了极大方便。由于表格栏目的局限性,不可能将所有的内容全部予以填充,所以,表格内的文字一定要精练、准确,能够高度概括,更为具体、详细的内容可以作为资料进行归档和留存。

3结语

设备事故分类篇6

【关键词】危险因素 因果图 分析

1施工危险因素的因果图分类法

因果图早先是用以表示质量特性与有关质量因素之间的因果关系。本文利用因果图来确定危险因素与施工安全事故之间的因果关系,进而对施工危险因素进行归纳分类和识别分析。

1.1 因果图分析方法

因果图,又称特性因素图,因形状像鱼刺,有人称他为鱼刺图,该图由日本质量管理专家石川馨于1943年提出,也称为石川图。

安全事故因果图由施工安全事故和危险因素两部分组成,如图1-1所示。图中主干箭头所指的为安全事故,主干上的大枝表示危险因素类别,中枝、小枝、细枝表示危险因素的依次展开。

因果图的作图步骤及方法如下:

第一步:确定待分析的安全事故,画主干箭杆、箭头,箭头向右,将安全事故写在箭头右侧的方框内。

第二步:确定安全事故中危险因素的分类方法,对不同类型的安全事故可按其影响因素(即:技术工艺因素(Method/ Technical)、材料因素(Material)、机械设备因素(Machine)、环境因素(Environment)、管理因素(Management)等)进行分类,。对每一类危险因素画出大枝,箭头方向从左到右倾斜指向主干并在箭头尾端写上危险因素分类项目。

第三步:将各分类项目分别展开,每个大枝上分出若干中枝表示各项目中造成安全事故的一个因素,中枝平行于主杆箭头,指向大枝。

第四步:将中枝进一步展开成小枝,小枝进一步展开成细枝的因素,依次展开,直细到能采取具体控制措施为止。

1.2 施工危险因素因果图分类分析

根据事故成因分析可知,施工安全事故是结果,各种危险因素是导致事故发生的原因。根据上述因果图的作图步骤方法,做出施工危险因素与施工安全事故的因果分析图,如图1-2所示,主箭头右端施工安全事故是指施工过程可能发生的所有安全事故,主箭杆上的大枝箭杆的尾部所标注的危险因素是指危险因素的类别,中枝、小枝、细枝所标注的危险因素是指引发事故的具体原因,这些危险因素的细分程度以能够采取具体的控制措施为标准。

由图1-2可以看出,造成安全事故的危险因素不外乎如下几种:技术工艺因素(Method/Technical)、材料因素(Material)、机械设备因素(Machine)、环境因素(Environment)、管理因素(Management),每种危险因素都包含一定数量的具体危险因素。不同事故类型的具体危险因素在不同施工阶段表现的形式和内容是有所不同的。

2施工过程的五类施工危险因素

为便于建筑工程施工安全事故危险因素分析研究,结合建筑工程施工安全管理的特点,根据图1-2的因果分析,我们把建筑工程项目施工过程的施工危险因素分成五类。

2.1技术工艺因素

技术工艺因素主要是指建筑工程在施工准备阶段所进行的施工组织设计中采用的各种专项施工方案、安全施工方案、安全技术标准等。在施工过程中采用的工艺标准是否成熟,是否存在安全隐患等等。

2.2材料因素

材料因素是指施工过程中采用的物质材料是否符合国家相关质量安全标准,安全材料的投入是否到位。

2.3机械设备因素

机械设备因素是指施工机械、设备在施工过程中是否处于完好正常运转状态,机械设备是否存在故障、机械设备的安全性能是否满足安全施工的要求。

2.4环境因素

环境因素就是指工程项目所在地的地质、地形、气象条件、周围环境以及施工现场布置是否合理、安全、整洁、有序,是否存在安全隐患。

2.5管理因素

管理因素与前四种因素是紧密相连的,在技术工艺因素、材料因素、机械设备因素、环境因素中都包含一定数量的危险因素,这些危险因素所处的状态和具有的危险性都与管理因素有直接或间接的关系。在管理因素中使前四种危险因素产生危险作用引发安全事故的因素就是管理方面的危险因素。

3基础施工阶段危险因素识别分析

基础施工阶段是工程实体施工的开始,各种危险因素开始逐步增多。根据本阶段要完成的分项工程,结合有关安全事故的统计资料分析,基础施工阶段可能发生的安全事故类型主要有:(1)施工坍塌事故;(2)物体打击事故;(3)起重伤害;(4)触电事故;(5)机械(具)伤害事故。

4主体施工阶段危险因素识别分析

主体施工阶段可能发生的安全事故最多,几乎所有事故类型都可能发生,但经常发生的也就是前面讨论过的六类:(1)高处坠落事故;(2)施工坍塌事故;(3)物体打击事故;(4)起重伤害;(5)触电事故;(6)机械(具)伤害事故。以高处坠落事故因果图分析为例,主体施工阶段引发高处坠落事故的具体危险因素有:(1)技术工艺因素有:高空作业防护方案存在安全缺陷、技术交底缺少安全内容或安全技术交底不全面、采用的施工技术工艺标准本身不符合安全要求;(2)材料因素有:脚手扳不符合安全质量要求造成施工过程中断裂发生坠落事故、脚手板有空隙、探头板、简易架子折断坍塌造成坠落,安全网、安全带不合格造成坠落;(3)机械设备因素有:垂直运输设备制动失灵造成坠落、机械设备操作失误发生坠落、机械设备碰撞;(4)环境因素有:雨雪天湿滑造成坠落、强风造成坠落、高温引起的中暑头晕或严寒引起的手脚不灵发生坠落;(5)管理因素有:高空作业未编制安全防护方案或方案未经审批、未做安全技术交底或交底不到位、洞口、楼梯口、电梯口、天井口和坑口无防护、楼面、屋顶、高台边缘无防护、无安全检查或检查不彻底。

5装饰安装阶段危险因素识别分析

装饰安装阶段是工程施工的收尾完工阶段,经过前二个阶段的施工,各种施工方案和安全措施已得到有效的检验,除临时用电外,继续延用的技术方案和安全措施,只要管理措施到位,一般不会产生新的危险因素。能够产生新的危险因素的相关因素有:新的技术方案(如:装饰安装没有施工方案、脚手架拆除没有方案)、新的材料等,该阶段可能会发生的安全事故有:(1)高处坠落事故;(2)物体打击事故;(3)起重伤害;(4)触电事故;(5)机械(具)伤害事故、以触电事故为例进行因果图分析,造成触电事故的危险因素有:技术工艺因素:线路不合理、装饰安装阶段中临时用电方案设计、未设接地保护和漏电保护;材料因素:用电线路绝缘老化、漏电保护失效;机械设备因素:机械损伤带电体绝缘部分、设备本身电路故障漏电;环境因素:绝缘体上导电粉尘过多、周围有强磁场造成设备自身带电、雨雪天潮湿漏电;管理因素:无安全用电培训、无安全技术交底、缺乏安全检查,无安全防护措施。

参考文献

[1]苏振民.建筑施工现场管理手册.中国建材工业出版社,1999.

设备事故分类篇7

[论文摘要]故障管理是计算机网络的管理最基本、最重要的功能。文中针对网络故障管理进行研究,并提出了网络故障管理智能化的方法,为网络故障智能化的进一步发展奠定了基础。

一个网络管理系统有五大功能域:故障管理、配置管理、性能管理、计费管理和安全管理其中,故障管理是最基本,也是最重要的功能。目的是保证网络能够连续可靠地运行。如果网络服务意外中止,将会对生产、生活造成很大影响,这就需要一套科学的故障管理策略,及时发现故障、排除故障。

现在一些网管软件趋向于将专家系统等人工智能技术引入到网络故障诊断和排除中。提高网络故障的智能水平有助于网络高效、可靠地运行。网络管理的智能化也是发展的必然趋势。为此本文针对网络故障智能化管理进行研究,并提出了建立事件知识库提高故障管理的智能水平的方法,为网络故障智能化的进一步发展奠定了基础。

1.计算机网络故障管理技术研究

(1)故障管理概述

故障是指软、硬件的缺陷;错误则是软硬件的不正确输出;失效是指所有和某故障有关的错误造成的网络的非正常运行。网络故障按生命周期可分为永久故障、暂时故障和瞬间故障三类;按故障对网络造成的空间失效范围的大小,可将失效分为四类:任务失效、基本网络部件失效、结点失效和子网失效。故障管理的主要任务是及时发现并排除网络故障。一般说来,故障管理包括以下几个内容:故障监测和捕获故障产生相关的事件和报警;定位分析故障、记录故障日志;如有可能排除故障等。

(2)故障管理的类型

故障类型指的是具有某种特征的故障的分类。通常我们可以根据故障发生来源的不同,将它们划分为两大类,即硬故障(harderrors)和软故障(softerrors)。

硬故障是指网络的硬件设备在工作过程中产生的各种错误。这些错误与该设备的作用有密切关系,网络系统的复杂性也正是由于设备的多样性而体现出来的。根据这网络设备的作用,我们也可以将故障简单分为以下三类:

①连接设备故障

这种故障的现象主要是网络的物理连接出现问题,也可以称为通路故障。造成故障的原因可能是电缆线断开、收发器断开或不能正常工作以及其它连接设备间的接口出问题等等。根据这类故障的来源不同,我们又可以将该类型的故障细分为线路故障、网络接口故障、收发器故障、路由器故障等等,该类故障是故障管理的最主要对象。

②共享设备故障

这种故障的表现是用于资源共享的设备出现问题,不能提供或享受所需的服务。同样,该类型的故障也可以细分为服务器故障(打印机故障、文件服务器故障等)、工作站故障等等。

③其它设备故障。包括电源故障、监控器故障、测试仪故障、分析仪故障等等。

软故障是指网络系统软件运行出错。软故障的发现和处理是在管理过程中逐渐被人们所认识的,因为软件属于一种无形的东西,问题的表现不如硬件那么直观。从这个意义上看,软故障的识别和诊断更加困难。故障管理中所处理的软故障主要针对与网络通讯和服务有关的系统软件,它可以直接根据网络软件来划分,包括通讯协议软件故障、网络文件系统(FNS)故障、文件传输软件故障、域名服务系统(DNS)等等,其中通讯协议软件故障是系统研究的重点。这种错误通常是在协议软件运行时遇到某个异常条件(如缓冲队列满)或协议软件本身未提供可靠机制而导致传输失败,报文丢失。

故障类型并不是一成不变的,随着网络在复杂性和规模上提高,网络故障管理的要求也在不断增加。新的技术、设备的应用使故障的类型、故障原因、故障源等各方面都发生了变化,这就要求故障管理系统必须增加新的内容。

(3)故障管理的功能

故障管理的根本目标在于排除网络中出现的各种故障,达到这一目标要求系统至少必须具备检测、隔离和纠正故障的能力。

故障检测(detection)是指对系统的性能和状态进行检查和测试,根据结果和一定的识别规则判断系统是否故障。故障检测要求管理系统监视网络的工作,考查网络的状态及其变化,一旦发现系统出现故障马上进行报警。

故障隔离(isolation)是指确定故障发生的位置,通俗地说就是指出谁发生了故障,如哪个子网、哪个设备或者设备的哪个部件,对于软故障则指明哪个系统出了问题。由于网络是一个复杂的系统,故障类型、原因、故障源多种多样,而且不同故障的表现可能完全相同,这就导致了故障隔离的复杂性。隔离系统应当尽可能地缩小故障源的范围。

故障纠正(correction)是指纠正所发生的错误,恢复系统的正常工作。故障纠正建立在前两者的基础之上,目前所采取的手段除了进行硬件维修、系统重启、一定程度的恢复外,还包括一些非技术性的活动,如人员的使用和技术培训以及设备生产厂商的支持等。

(4)影响故障管理的因素

与网络管理一样,故障管理也必须考虑三方面的因素:过程、设备和工具、人员。成功的故障管理策略是这三者的完整结合,而不仅仅是其中的某一个方面。

过程主要指为实现故障管理功能而进行的操作,下一节介绍的内容就属于故障管理的过程。了解管理的一般过程是开发一个实用的故障管理系统的基础。

设备和工具指的是进行故障管理的软硬件工具,包括故障检测设备、维修设备、实用的故障管理系统等。设备和工具在故障管理中起着非常重要的作用,它可以帮助管理员和工程师实施管理功能,排除故障,保障网络系统正常运转。下面介绍的就是几种专用的物理设备:

①时间域反射测量仪(TDR)。通过显示物理介质传输信号的波形表明设备或链路是否故障。

②网络监视器。监视网络上各结点的状态,得到网络的各种统计数字,以确定是否故障。

③网络分析仪。实时分析结点的收发报文,帮助管理者跟踪和隔离故障。管理人员在故障管理中的任务主要是维护管理系统和工具的运行,并在它们的帮助下完成故障排除和系统恢复工作。

2.智能化网络管理的概述

为了能够更有效地对各种大型复杂的网络进行管理,许多研究人员将人工智能技术应用到网络管理领域。虽然全面的智能化的网络管理距离实际应用还有相当长的一段路要走,但是在网络管理的特定领域实施智能化,尤其是基于专家系统技术的网络管理是可行的。

用于故障管理的专家系统由知识库、推理机、知识获取模块和解释接口四大主要部分组成。专家系统以其实时性、协作管理、层次性等特点,特别适合用在网络的故障管理领域。但同时专家系统也面临一些难题:

(1)动态的网络变化可能需要经常更新知识库。

(2)由于网络故障可能会相关到其它许多事件,很难确定与某一症状相关的时间的开始和结束,解释和综合消息复杂。

(3)可能需要大量的指令用以标识实际的网络状态,并且专家系统需要和它们接口。

(4)专家系统的知识获取一直以来是瓶颈所在,要想成功地获取网络故障知识,需要经验丰富的网络专家。

在实现智能化网络管理系统时,还必须把握系统复杂性与系统性能的关系。不仅要利用将较为成熟的人工智能技术,而且要考虑实现上的复杂度和引入人工智能技术对系统性能和稳定性的影响。

3.事件知识库的研究

在专家系统中,知识的表示有逻辑表示法、语义网络表示法、规则表示法、特性表示法、框架表示法和过程表示法。产生式表示法,即规则表示法,是最常见的一种表示法。其特点是模块性、一致性和自然。知识库是知识的集合,严格意义上的知识库包括概念、事实和规则只部分,缺一不可。

为了提高故障管理的智能水平,可以建立事件知识库(EKB,EventKnowledgeBase,

用于存储所有己知事件的类型、产生事件的原因和所造成的影响,以及应该采取什么样的措施等一些细节的静态描述。这个EKB并不是真正意义上的知识库,它的数据仅仅包含了属性值与元组,而属性值表示概念,元组表示事实。但研究EKB可以为今后建立完善的知识库奠定基础。

在EKB中存储了己经确定事件。最初,被确定的事件仅限于一些标准事件和措施。随着网络的运行和系统的反馈,EKB的内容将不断增加。

理想状态是能够确定所有的事件。

下面是EKB涉及到的只种基本的数据库表:

(1)事件类型表:该表中主要存储了事件的静态定义。

EKB中保存了己确定的事件可能涉及的相关知识,如事件类别(如:性能、系统、网络、应用事件或其它)、严重程度(如:严重、主要、次要、警告等)、产生事件的设备标识、指明设备的类型、事件造成什么影响(如:影响网速、单个用户不能访问等)、故障排除参考策略、上次更新的时期/时间、关于这个事件的备注信息、事件的详细描述等。

(2)实时事件表:描述了正在运行的网络中的实时事件。

实时事件表中提供可能用的一些字段,用于记录网络运行中发生的事件,如:设备的ID(从IP地址或查询设备表可以获得)、实时事件的状态(如:新增、确认、清除等)、根据故障票ID获得的相应的故障票信息等。

(3)设备信息表:存储了网络中设备的实际参数。

设备信息表主要记录了每个设备的相关参数。例如,设备ID号、IP地址、设备名称、厂商、类型、重要性级别等。

EKB中存储的相关事件的知识主要来源于专家。开发人员将获得的知识应用到与故障管理相关的系统中,根据不同系统的需要分配相应的知识,以提高系统性能。虽然EKB并不是严格意义上的知识库,但在开发过程中,可以通过不断地增加和修正EKB的内容,在一定程度上提高系统的智能水平。

4.结论

文中分析了网络故障的类型,提出将事件知识库用于计算机网络故障的智能管理。实验表明,计算机网络故障的智能管理提供了基于知识的决策手段,比传统的管理方式具有更高的决策水平,为专家系统技术在故障的检测和隔离方面更加广泛的应用,奠定了一定基础。

参考文献:

[1]赵志囡等.计算机网络中的服务[M].现代情报.2006.(11)

设备事故分类篇8

(1)故障管理概述

故障是指软、硬件的缺陷;错误则是软硬件的不正确输出;失效是指所有和某故障有关的错误造成的网络的非正常运行。网络故障按生命周期可分为永久故障、暂时故障和瞬间故障三类;按故障对网络造成的空间失效范围的大小,可将失效分为四类:任务失效、基本网络部件失效、结点失效和子网失效。故障管理的主要任务是及时发现并排除网络故障。一般说来,故障管理包括以下几个内容:故障监测和捕获故障产生相关的事件和报警;定位分析故障、记录故障日志;如有可能排除故障等。

(2)故障管理的类型

故障类型指的是具有某种特征的故障的分类。通常我们可以根据故障发生来源的不同,将它们划分为两大类,即硬故障(harderrors)和软故障(softerrors)。

硬故障是指网络的硬件设备在工作过程中产生的各种错误。这些错误与该设备的作用有密切关系,网络系统的复杂性也正是由于设备的多样性而体现出来的。根据这网络设备的作用,我们也可以将故障简单分为以下三类:

①连接设备故障

这种故障的现象主要是网络的物理连接出现问题,也可以称为通路故障。造成故障的原因可能是电缆线断开、收发器断开或不能正常工作以及其它连接设备间的接口出问题等等。根据这类故障的来源不同,我们又可以将该类型的故障细分为线路故障、网络接口故障、收发器故障、路由器故障等等,该类故障是故障管理的最主要对象。

②共享设备故障

这种故障的表现是用于资源共享的设备出现问题,不能提供或享受所需的服务。同样,该类型的故障也可以细分为服务器故障(打印机故障、文件服务器故障等)、工作站故障等等。

③其它设备故障。包括电源故障、监控器故障、测试仪故障、分析仪故障等等。

软故障是指网络系统软件运行出错。软故障的发现和处理是在管理过程中逐渐被人们所认识的,因为软件属于一种无形的东西,问题的表现不如硬件那么直观。从这个意义上看,软故障的识别和诊断更加困难。故障管理中所处理的软故障主要针对与网络通讯和服务有关的系统软件,它可以直接根据网络软件来划分,包括通讯协议软件故障、网络文件系统(FNS)故障、文件传输软件故障、域名服务系统(DNS)等等,其中通讯协议软件故障是系统研究的重点。这种错误通常是在协议软件运行时遇到某个异常条件(如缓冲队列满)或协议软件本身未提供可靠机制而导致传输失败,报文丢失。

故障类型并不是一成不变的,随着网络在复杂性和规模上提高,网络故障管理的要求也在不断增加。新的技术、设备的应用使故障的类型、故障原因、故障源等各方面都发生了变化,这就要求故障管理系统必须增加新的内容。

(3)故障管理的功能

故障管理的根本目标在于排除网络中出现的各种故障,达到这一目标要求系统至少必须具备检测、隔离和纠正故障的能力。

故障检测(detection)是指对系统的性能和状态进行检查和测试,根据结果和一定的识别规则判断系统是否故障。故障检测要求管理系统监视网络的工作,考查网络的状态及其变化,一旦发现系统出现故障马上进行报警。

故障隔离(isolation)是指确定故障发生的位置,通俗地说就是指出谁发生了故障,如哪个子网、哪个设备或者设备的哪个部件,对于软故障则指明哪个系统出了问题。由于网络是一个复杂的系统,故障类型、原因、故障源多种多样,而且不同故障的表现可能完全相同,这就导致了故障隔离的复杂性。隔离系统应当尽可能地缩小故障源的范围。

故障纠正(correction)是指纠正所发生的错误,恢复系统的正常工作。故障纠正建立在前两者的基础之上,目前所采取的手段除了进行硬件维修、系统重启、一定程度的恢复外,还包括一些非技术性的活动,如人员的使用和技术培训以及设备生产厂商的支持等。

(4)影响故障管理的因素

与网络管理一样,故障管理也必须考虑三方面的因素:过程、设备和工具、人员。成功的故障管理策略是这三者的完整结合,而不仅仅是其中的某一个方面。

过程主要指为实现故障管理功能而进行的操作,下一节介绍的内容就属于故障管理的过程。了解管理的一般过程是开发一个实用的故障管理系统的基础。

设备和工具指的是进行故障管理的软硬件工具,包括故障检测设备、维修设备、实用的故障管理系统等。设备和工具在故障管理中起着非常重要的作用,它可以帮助管理员和工程师实施管理功能,排除故障,保障网络系统正常运转。

下面介绍的就是几种专用的物理设备:

①时间域反射测量仪(TDR)。通过显示物理介质传输信号的波形表明设备或链路是否故障。

②网络监视器。监视网络上各结点的状态,得到网络的各种统计数字,以确定是否故障。

③网络分析仪。实时分析结点的收发报文,帮助管理者跟踪和隔离故障。管理人员在故障管理中的任务主要是维护管理系统和工具的运行,并在它们的帮助下完成故障排除和系统恢复工作。

2.智能化网络管理的概述

为了能够更有效地对各种大型复杂的网络进行管理,许多研究人员将人工智能技术应用到网络管理领域。虽然全面的智能化的网络管理距离实际应用还有相当长的一段路要走,但是在网络管理的特定领域实施智能化,尤其是基于专家系统技术的网络管理是可行的。

用于故障管理的专家系统由知识库、推理机、知识获取模块和解释接口四大主要部分组成。专家系统以其实时性、协作管理、层次性等特点,特别适合用在网络的故障管理领域。但同时专家系统也面临一些难题:

(1)动态的网络变化可能需要经常更新知识库。

(2)由于网络故障可能会相关到其它许多事件,很难确定与某一症状相关的时间的开始和结束,解释和综合消息复杂。

(3)可能需要大量的指令用以标识实际的网络状态,并且专家系统需要和它们接口。

(4)专家系统的知识获取一直以来是瓶颈所在,要想成功地获取网络故障知识,需要经验丰富的网络专家。

在实现智能化网络管理系统时,还必须把握系统复杂性与系统性能的关系。不仅要利用将较为成熟的人工智能技术,而且要考虑实现上的复杂度和引入人工智能技术对系统性能和稳定性的影响。

3.事件知识库的研究

在专家系统中,知识的表示有逻辑表示法、语义网络表示法、规则表示法、特性表示法、框架表示法和过程表示法。产生式表示法,即规则表示法,是最常见的一种表示法。其特点是模块性、一致性和自然。知识库是知识的集合,严格意义上的知识库包括概念、事实和规则只部分,缺一不可。

为了提高故障管理的智能水平,可以建立事件知识库(EKB,EventKnowledgeBase,用于存储所有己知事件的类型、产生事件的原因和所造成的影响,以及应该采取什么样的措施等一些细节的静态描述。这个EKB并不是真正意义上的知识库,它的数据仅仅包含了属性值与元组,而属性值表示概念,元组表示事实。但研究EKB可以为今后建立完善的知识库奠定基础。

在EKB中存储了己经确定事件。最初,被确定的事件仅限于一些标准事件和措施。随着网络的运行和系统的反馈,EKB的内容将不断增加。

理想状态是能够确定所有的事件。

下面是EKB涉及到的只种基本的数据库表:

(1)事件类型表:该表中主要存储了事件的静态定义。

EKB中保存了己确定的事件可能涉及的相关知识,如事件类别(如:性能、系统、网络、应用事件或其它)、严重程度(如:严重、主要、次要、警告等)、产生事件的设备标识、指明设备的类型、事件造成什么影响(如:影响网速、单个用户不能访问等)、故障排除参考策略、上次更新的时期/时间、关于这个事件的备注信息、事件的详细描述等。

(2)实时事件表:描述了正在运行的网络中的实时事件。

实时事件表中提供可能用的一些字段,用于记录网络运行中发生的事件,如:设备的ID(从IP地址或查询设备表可以获得)、实时事件的状态(如:新增、确认、清除等)、根据故障票ID获得的相应的故障票信息等。

(3)设备信息表:存储了网络中设备的实际参数。

设备信息表主要记录了每个设备的相关参数。例如,设备ID号、IP地址、设备名称、厂商、类型、重要性级别等。

EKB中存储的相关事件的知识主要来源于专家。开发人员将获得的知识应用到与故障管理相关的系统中,根据不同系统的需要分配相应的知识,以提高系统性能。虽然EKB并不是严格意义上的知识库,但在开发过程中,可以通过不断地增加和修正EKB的内容,在一定程度上提高系统的智能水平。

4.结论

文中分析了网络故障的类型,提出将事件知识库用于计算机网络故障的智能管理。实验表明,计算机网络故障的智能管理提供了基于知识的决策手段,比传统的管理方式具有更高的决策水平,为专家系统技术在故障的检测和隔离方面更加广泛的应用,奠定了一定基础。

推荐期刊