引言
甘肃大唐甘谷发电厂以大代小改造工程为2X330MW机组,2007年年底两台机组顺利通过168试运行,成功投产开始商业运行。其分散控制系统(DCS)采用GE新华控制工程有限公司的XDPS-400e型。XDPS-400e型分散控制系统是GE新华XDPS-400+系统的升级系统,主要是在系统的硬件结构上做了较大的改进,在同类机组容量的电厂也是首次应用。它的功能包括数据采集系统(DAS)、模拟量控制系统(MCS)、炉膛安全监控系统(FSSS)、顺序控制系统(SCS)、电气系统(ECS)、汽轮机控制系统(DEH)、旁路控制系统(BPC)等。
1 网络配置
大唐甘谷发电厂两台机组DCS系统设置2个独立的双环网,每台机组一个环网,公用系统一个星型网。公用系统与单元机组之间采用专用网桥联接在一起。单元机组网络配置分为两部分,主干网和实时信息网。主干网为100Mb冗余、容错高速实时双环网。冗余是指2条环网同时工作,互为热备用。 容错是指当环网中任何两个站点间的线路发生故障或任何站点故障时,环网将自动退化为星型以太网,不会影响系统的正常工作。实时信息网是把系统上所有的人机接口(MMI)构成一个实时总线网,以实现人机接口之间的信息资源数据共享。实时信息网由SMC交换机EZ1024R 100Mbps快速以太网交换机构成。公用系统网络配置公用系统为一个独立的星型网,通过专用网桥与单元机组DCS网络联接在一起。网桥具有隔离性使3个DCS(#1机组DCS、#2机组DCS、公用系统DCS)网之间在电气上相互独立避免耦合。在操作上通过软开关和硬开关两种方式保证同一时间只能由一台机组对公用系统操作。
2 出现的故障及其原因分析
2008年4月16日10点48分,正常运行中的#2机组操作员站、工程师站所有监控数据品质坏,操作员无法监控,故障持续近两分钟后值长令手动停炉和手动停机,直接造成2#机组非计划停运。
通过检查#2机组报警历史记录,10:47:48至10:48:04期间,报警信号“SAC10DI003单元控制室空调系统#2总报警1”在短时间内大量重复出现,紧接着DCS系统所有控制器出现复位现象。由于此信号为现场采集的信号,如此高频率的出现不可能是实际产生;又因为此信号为公共系统采集的信号,同时通讯至#1机组,通过对比#1机组的报警历史,亦排除了信号故障的可能。
通过排除法,最后我们分析,在这一段时间内,#2机组系统网络发生阻塞,造成网络负荷剧增,引起控制器复位,而网络发生阻塞的可能原因我们分析有以下几个方面:
1、 工作人员在处理其他问题的时候不小心将控制器复位,通过检查电子间进出记录和机组历史记录,可以肯定排除人员误动的原因。
2、 虚拟环网发生“短路”,即在整个网络没有产生断点的情况下,虚拟断点闭合,造成网络形成环路,网上数据不断被重复复制,网络负荷剧增。如交换机虚拟断点开关被误动。
3、 网络结构不合理,造成网络形成环路。从产生的现象及故障发生前的运行情况来看,可以排除这种可能性。
4、 网络上某个节点网络接口故障,向网络上大量发送重复数据,造成网络阻塞。如公共系统与单元机组网关站的网卡故障。
3 采取的措施
针对出现的情况,我们制定了如下预防措施:
1、加强相关人员交换机设备使用的培训工作,在交换机机柜醒目处贴警示标志,避免人员误动。
2、更换网关站与#2机组接口的网络接口卡。
3、交换机增加端口的流量限制。
显然,这次事故采取的这些措施里重中之重是交换机流量限制的设置,如果在事故发生之前我们已经设置了流量限制,那么即使出现虚拟断点闭合或节点网络接口故障时,也不会因为向网络大量发送数据而造成网络负荷剧增,最终导致非停的结果。
4 交换机流量限制的设置
大唐甘谷发电厂网络为单层、快速交换式以太网,实时网(RTFNET)允许最大节点量为1024个,信息网(INFNET)允许最大节点量为250个。主干网由德国Hirschmann工业级交换机构成,有RS20-1600M2M2SDAE交换机5对。公用系统网络也由德国Hirschmann工业级交换机构成,有RS2-TX交换机2对。交换机流量设置在#1、#2机组工程师站进行,安装JAVA程序和专用Hirschmann软件后,即可在工程师站对交换机流量进行设置,我们根据实际数据传输情况,定义交换机光口速率为15000,电口速率为1500,当然,具体设置步骤因交换机类型不同而不同,这里不再赘述。
5 结束语
近年来,国内火电机组发展迅速,机组从开工建设到投产的工程时间也大大缩短,在紧张的工期情况下,施工、调试单位难免留下工程隐患,作为电厂的主人,我们在紧抓大层面、大缺陷的同时,也要定期组织分析案例、细化设备保护、强化人员素质,让非停事故、安全事故不要成为新厂的“宠儿”!
全部回复(1 )
只看楼主 我来说两句 抢板凳