数据中心管理人员,尤其是那些负责设施监督,必须为产生营收的业务运营提供支持的数据中心管理人员们正在不断努力,以克服停机的威胁,这是理所当然的。研究表明,仅仅一分钟的停机时间平均带来的损失将超过7,900美元,而长时间的断电无疑将严重影响到企业的运行,甚至可能让数据中心管理人员被解雇。
减少这种风险的最佳方式之一便是对支持数据中心不间断电源(UPS)的电池实施维护。在一系列的电池组中,仅仅只是一处损坏就能引起您的UPS在发生中断时运行失败。而维护电池的第一步是要了解他们真正的使用寿命,并通过相关策略使您数据中心的关键基础设施发挥最大价值。
电池的使用寿命
如果你的数据中心采用UPS电池管理关键设备已经有一段时间了,你可能已经发现,电池制造商所设计的电池寿命并不与电池真正的使用寿命相同。设计的寿命是制造商在实验室考虑到电池的设计和电池老化的条件下所得出的。而电池实际的使用寿命不仅仅需要考虑电池老化的影响,还需要考虑到其是如何被应用,安装和维护的。简单地说,认为电池的设计寿命和实际使用寿命是相同的,会让您的数据中心存在风险。
艾默生网络能源公司旗下Liebert Services团队所服务的电池组超过40000串,执行了高达600000次的检查或维修访问。因此,我们对于电池真正的使用寿命有着深刻的理解。根据我们在这方面的经验,即使电池的设计寿命可达10年或以上,但基于运行环境和维护等几个方面的因素,其很可能在使用了三年之后就已经开始不怎么好用了。UPS和电池维护是实现最佳性能和电池投资回报的两大重要因素。
电池的维护
进行预防维修和主动更换电池计划可以在发生停电、线路高峰、意外断电、及其他电源相关的问题时大大减少中断失败的风险。
一项针对超过5000台三相UPS单位和24000多串电池的研究发现,定期预防性维护对于保证UPS可靠性的作用是相当明显的。这项研究表明,一年的平均故障间隔时间(Mean Time Between Failure,MTBF)内获得两次预防性维护(PM)服务访问的单位比未实施预防性维护访问的UPS的性能好23倍。根据该项研究,技术熟练的服务提供商具有非常低的错误率,进一步使得可靠性稳步增长。
数据表明,平均故障间隔时间(MTBF)与可预防性维护次数成正比。(来源:艾默生网络能源)
通常,重要的PM访问任务包括对设备实施完整的视觉检查,其中就有配件,电线,电缆和所有的断路器,以及检查空气过滤器是否清洁。在该PM服务结束之后,系统的运行测试应包括单位转移和电池放电。然而,在一个更全面的电池管理程序中,监控才是关键。
电池监控服务
在一项针对累积运行时间超过了7亿小时,覆盖了电池使用寿命超过三年的数据分析中发现,较之那些未安装电池监控系统的数据中心,那些已经安装了电池监控系统的数据中心能够大大减少由于电池故障所引发的运行中断的几率。尽管这些数据中心仍然可能发生中断事故,这些事故均是由人为的操作错误包括没有认真查看系统或不知道如何正确分析监测数据等孤立因素造成的。这同时也显示了数据中心需要相关的专家来正确的监测报警数据,维护系统。
这些电池监测服务增添了一个高水平的保护,增强了数据中心对于其关键基础设施的信心,让数据中心管理人员能够安心的知道其电池是被监控的,进而实现了将非计划停机降到最小化的可能性。此外,这种持续性的监控,允许数据中心根据趋势分析来规划未来的电池投资。
对于今天繁忙的数据中心和IT经理们而言,一个倍受欢迎的方案是采用远程分析服务来分析固定电池的监控,将远程监控技术嵌入到电源保护基础设施。这种技术应包括综合数据采集以便能够尽早的提供预警。
利用强大的远程监控技术,负责管理重要基础设施的单个管理员不必是专家,目前也能够在复杂的数据中心管理各种技术,同时也能够增加工作人员的数量。凭借其嵌入式能力,监控功能还使管理员能够提高平均无故障时间和平均修复时间(MTTR)。
通过正确的监测技术,提高MTTR是可能的。因为连续的连接允许基础设施专家提供最高水平的支持。他们能够不断地收集和分析关键参数数据,并将这些信息转换为可操作的计划。这种远程诊断可以让维修技师更明智,使他们到达出现故障的设备之前,就能够有针对性的瞄准需要修复的地方。
最终,远程UPS和电池监测,恢复一个UPS操作的时间远远小于一个连续时间的方法,在后者中,一个简单的事件也可能超过八小时。具备早期发现潜在问题的能力、以及针对缺陷或电池退化快速做出响应,能够最大化UPS电池系统的可靠性,使你的数据中心保持的当今数据中心所需的动态适应性。
鉴于企业业务对于数据中心系统依赖性的增强,数据中心需要把更多的重点放在数据中心的可用性和关键电源系统的可靠性方面,数据中心管理人员必须知道如何最好地避免停机,这意味着必须了解你的UPS电池的实际使用寿命和实施预防性维护的最佳实践。凭借全面的预防性维修计划,包括远程监控服务,进而避免代价高昂的停机时间,而且最重要的是,保障你数据中心的正常运作!