UPS
电源是工业领域用来对负载进行断电保护的关键设备。对于断电保护,针对不同的负载应用,又有两种类型。一种是普通的电脑类设备,当断电发生时,
UPS
电源需要为负载提供几分钟到十几分钟的后备供电时间。在这段后备时间之内,负载设备会进行数据存储等动作以防数据丢失,之后负载就会关机。在
UPS
达到后备时间之后负载仍然会断电,但这不会导致经济损失。另外一种是在数据中心以及工业应用之类的场合,对
UPS
的要求就是真正的不断电,
UPS
系统必须提供整年每天
24
小时的连续供电。本文对可靠性与可用性的讨论就是针对的这种情况。
电源系统的可靠性通常可以使用
MTBF
(平均故障间隔时间,或者平均无故障工作时间,以小时表示)来表示,此外还有一个更加容易理解的指标
AFR
(年失效率)。
AFR
和
MTBF
成反比关系,也就是
AFR=8760/MTBF.
因此,
MTBF
越长,则年失效率越低。
对于可维修的系统来说,还有一个可用性的指标,其定义为:
A=MTBF/(MTBF+MTTR)
其中,
A
是一个百分比指标,
MTTR
值是平均故障修复时间。如果系统出现故障时可以非常快速的恢复,那么系统的可用性指标就比较高。对于电网这类对象来说,使用可用性指标可以更加直观的衡量其可靠程度。而对于在关键场合经常使用并联冗余配置来说,可用性指标比可靠性指标更具有现实意义。
可靠性
/
可用性指标都是统计意义上的概念,一个电源系统的可靠性
/
可用性与构成系统的各个模块的可靠性
/
可用性之间也存在统计意义上的关联。
假设电源系统中存在两个电源模块,而这两个模块是并联工作的,其中一个和另外一个是互相独立的(如图
1
所示)。
那么,考察这两个模块组合起来的系统的可用性
Asys
与每个模块各自的可用性
A1
与
A2
的关系就有:
Asys=1-(1-AFR1)×(1-AFR2)
另外一种可能是系统中这两个模块是串联的
。
那么,这两个模块组合起来的系统的可用性
Asys
与每个模块各自的可靠性
A1
,
A2
的关系就有:
Asys=A1×A2
由于可用性肯定是处于
0
~
1
之间的数值,因此,两个并联模块的总体可用性要高于各自的可用性,而两个串联模块的可用性要低于各自的可用性。
从单个
UPS
的设计来说,可以把整个产品按照模块进行划分,图
3
是一个典型的
UPS
系统结构图。
从图
3
中可以看到,
UPS
各个模块之间的依赖关系比较复杂,但是还是可以分出串并联的关系。
辅助电源与所有其它模块都是串联的,因此,辅助电源的可用性直接限制了系统能够达到的最高可用性等级;
控制模块与除辅助电源之外的其它模块也都是串联的,因此,控制模块的可用性也会直接影响到系统的总体可用性设计;
对于负载端来说,能够直接相连的只有旁路模块与逆变模块,而这两个模块是并联的;
PFC/
整流模块与电池升压模块是并联的,之后再与逆变模块串联;
从能源提供者来讲,这里旁路电源与市电电源是两路独立的电源,而电池能源是由市电经过充电模块提供的。如果充电模块故障的话电池就没有能量存储,实际上也无法实现正常的
UPS
功能,因此,市电
—
充电模块
—
电池也是串联的。这样可以画出整个
UPS
系统的可用性串并联路径图。
从这一路径关系里可以看到,总共存在
3
条并联的路径,而每一条路径各自又是由数个模块串联起来的。正与前面分析的一样,辅助电源与控制模块的可用性是串联在所有通路上的,因此,如果这两者设计有缺陷的话,
UPS
的可用性无法做的很高。电池回路串联有最多的模块数量,也是可用性最低的一条路径。
要提升系统的可用性首先要提升关键路径的可用性。从路径图上
可以看到,控制模块与辅助电源。辅助电源是整个
UPS
的关键点,如果辅助电源不工作,整个
UPS
都将瘫痪。提升辅助电源可用性的方式可以有很多种方案:一种是改进设计,提升
MTBF
;一种是对辅助电源也适用并联冗余设计,提升可用性;再一种是对
UPS
的三条可用性路径分别使用不同的辅助电源,相当于把原来完全串联的路径改成并联。在
UPS
设计中可以混合使用这几种方式,由于上面三条可用性通路是并联的,而旁路通路本身是可用性最高的一条,因此,最为推荐的设计就是优先提升旁路的可用性,对旁路单独使用一套辅助电源供电,并且,这套电源的尽量采用简单的设计,以拥有高的
MTBF.
控制模块同样也是影响到所有路径的关键点,也必须拥有高的可用性。参照辅助电源的处理方法,也可以给相对独立的旁路路径配备单独的控制模块,并且通过与其余控制功能协调工作来达到高可用性的目的。同样,旁路上的控制模块也要尽量简单,以提升可靠性。一种推荐的做法是旁路控制模块不断的检测
UPS
主控制模块的状态,如果发现主控制模块,则自动切换到旁路方式。此外,对于主控制模块来说,也可以通过冗余的方式来提升可用性,比如采用双
MCU
结构,当一个
MCU
检测到另外一个
MCU
发生故障时可以接管另一个
MCU
的功能,或者采取紧急措施(如转旁路)来保证负载不断电。
对于
UPS
来说,电池是保证
UPS
能够在市电或者旁路断电发生时继续维持供电的关键,但是串联环节最多,也恰恰是可用性最为薄弱的环节。一般电池规格书里面会说明充电电流不要超过
0.15CC
,这就意味着电池在
UPS
满载放电放完之后要用数倍的时间才能重新充满,从这个意义上讲其可用性一般都在
20%
以下。但是,由于电池并不是连续工作的,只要在电池放完前市电恢复,在重新充电的过程中也没有再发生断电,那么负载仍然不会受到影响。从这方面来看,电池的可用性在只会发生短时间的断电情况下还是比较高的。
再重新来审视电池回路的可靠性,在电池与市电之间还有一个充电器模块环节。如果充电器损坏则电池在一次放完电之后就无法再充回,导致下一次市电停电时负载断电。但是充电器只是在电池需要充电时才会工作,因此,如果能够及时对充电器的状态进行监控,在发现充电器异常时及时报警,就能够避免充电器故障带来的问题,从而提升整个
UPS
的可用性。对于电池也有一样的手段。电池在使用多次之后也会面临容量下降和失效的问题,但是如果能够通过电池状态监控发现电池失效并及时更换,也能够有效提升
UPS
的可用性。
由于
UPS
并非一个单独的应用系统,而是要搭配有其它一些环境因素在里面,所以这些外部因素也是必须考虑进来。前面提到过,
UPS
电池的备电时间是有限的,如果断电时间比较长,导致电池电放完,那么负载就仍然会断电。因此,
UPS
可用性会受到市电发生长时间断电概率的影响。
为了解决这一瓶颈,可以在
UPS
系统中加入一个特性和电池互补的备用电源:在市电断电时不需要很快反应,但是在长时间停电条件下能够持续提供电力,燃油发电机组就是最为合适的一个选择。因此,在
UPS
系统配置上可以加入一个自动切换装置,在市电停电后切换到发电机组。这样能够极大的提升长时间断电条件下
UPS
系统的可用性。如此,
UPS
系统的可用性路径就可以形成
。
虽然在可用性路径里面多串联了一个市电与发电机切换用的
ATS
,增加了单调路径发生故障的概率,但是相对长时间断电带来的可用性问题来说还是值得的。
在
UPS
应用的另外一个分支是目前正在兴起的直流
UPS
系统。直流系统的思路是出于提高效率的目的,减少电源系统中间的转换环节,电力分配部分由原来的交流转换成直流。
可以看出,理想的直流
UPS
系统由于把交流系统中
UPS
的逆变环节与服务器电源中的
PFC
环节使用一个隔离型
DC/DC
环节来取代,从而可以改善效率。不过,在直流
UPS
系统里面由于电池电压的变动范围是比较大的,为了取得更优化的效率曲线,在后级的服务器电源中也有可能使用两级结构,也就是通过一个简单的转换,减小服务器电源隔离
DC/DC
转换级的输入范围,以得到更好的节能效果。
在这种直流
UPS
体系里面,不存在交流
UPS
中的旁路回路了,只存在一个市电到电池回路,这个回路也兼有充电器的作用。因此,从单个
UPS
的可靠性角度考虑,直流
UPS
可靠性链路只有两条,其中一条是两级变换加上辅助电源与控制板,另外一条是电池
。
与交流
UPS
相比,直流
UPS
供电少了交流
UPS
的旁路回路,少了一个提升可用性的回路。但是电池是直接给负载供电的,可用性要高于交流
UPS.
因此,在可用性的方面,直流供电系统有得有失。但是另一个方面,直流系统比交流
UPS
更容易进行并联,从而可以利用增加并联台数的方式增加可用性。
对于一般的
UPS
系统应用来说,存在两种常见的配置方式,一种是双机热备份
。
在正常情况下由
UPS1
供电,如果
UPS1
的逆变
/
整流部分损坏,则仍然有
UPS2
可以供电。第二种配置方式是双机并联冗余
。
这种配置方式下两台
UPS
是完全并联工作的。基于前面可用性的原理,第二种配置方式比第一种会有更高的可用性。
这里就反映了可用性与可靠性的一个明显不同。对于两台并联冗余配置的
UPS
,由于器件多了一倍,那么出现故障的概率也会增高,因此,从统计意义上来讲,整个系统的
MTBF
会下降。但是,由于其中一台出现故障之后仍然有一台在工作,只要出故障的
UPS
能够很快修复,负载就仍然处在有效的保护之中,可用性是提升的。从负载的角度衡量,评估系统的可用性比可靠性更加有意义。
全部回复(1 )
只看楼主 我来说两句 抢板凳