数据中心基础设施管理解决方案其作用


 

资产管理是数据中心基础设施管理的一个关键组成部分。一家数据中心可以包含成千上万的资产,从服务器、存储设备和网络设备到电源和冷却设施。跟踪这些资产是一个持续不断的而且相当艰巨的任务。根据一家数字房地产信托机构针对数据中心管理人员的调查:他们需要可以多久才能找到服务器的功能已经开始下降。只有26%的受访者说他们可以在几分钟内找到服务器。有58%的受访者表示可以在4小时内找到,而20%的受访者表示需要超过一天的时间。无法找到数据中心的故障设备增加了设备的平均修复时间(MTTR),降低了整体可用性。

然而,资产管理所包括的绝不是简单的定位数据中心资产。它还涉及到资产配置的详细信息。例如,一台服务器可以由一台或多台机架电源插座供电。断开这些电源将关闭服务器。服务器可以连接到一台或多台交换机或路由器。

将这些网络设备改道,可以使服务器无法访问。服务器可以承载多台虚拟机。关闭服务器,将禁用这些虚拟机。不知道服务器配置的细节,是很难关于该服务器及其配套设施做出合理的决策。配置的任何部分的变化可能会导致服务器及其相关服务无法使用。

为了准确地管理资产和他们的详细配置,我们还必须管理相关的变化。据估计,多达80%的系统停机时间往往是由这些变化造成的,而80%的平均修复时间(MTTR)是耗在了试图确定发生了什么样的变化。变更管理因此成为数据中心基础设施管理解决方案的一个重要的部分。在《TheVisibleOpsHandbook:ImplementingITILin4PracticalandAuditableSteps》一书中,作者研究了一批高性能的IT企业发现,通过查看企业资产的计划和授权的变化(以及资产实际检测的变化),数据中心管理人员可以不再需要花费以往那么长的时间来确定如何解决问题了,而且第一词准确定位故障的准确率可以超过90%.作者还发现,企业实施自动变更审计使得他们对于很多变更都感到十分惊讶和震惊。同时跟踪授权的变更和检测的变更,以及不一定授权的变更是数据中心基础设施管理的关键功能,可以减少平均修复时间,提高整体系统的可用性。

实时监测

在数据中心的实时监控系统有三个类别:

l建筑物管理系统(BMS):BMS系统是一个典型的基于硬件的系统,利用Modbus、BACnet、OPC、LonWorks或简易网络管理通讯协议(SNMP)监测和控制的建筑机械和电气设备。这些往往是定制系统售价的单个数据点进行监测(数据点可能是输出负载的UPS或计算机房空调机组的回流温度)。在某些情况下,BMS系统扩展到数据中心,以监测和控制电源和冷却设备。

l网络管理系统(NMS):网络管理系统通常是基于软件的系统,利用SNMP来监控数据中心的网络设备。通常可以自动发现网络设备,因此在一定程度上可以自动安装。