1 引言
数据中心基础设施广义上包括IT设备、机房以及与机房相关的各类设备。本文仅讨论狭义上的数据中心基础设施,即为保证各类IT设备正常运行提供基础环境的供电设施、制冷设施、安防设施和消防设施等。
20世纪90年代,数据中心崛起时密度低,能源成本尚未成为发展的制约因素,运营商对数据中心的管理是粗放式的:通过过度规划电源和制冷来保证安全;分散负载以保证资源对业务的高性能持续支撑;在设备投资和储备上过度花费,为不使用的设备持续支付维护费用;忽视对低负载率情况下的低运行效率和高固定成本。目前,随着业务需求的不断膨胀,数据中心规模快速扩大,能耗和运维模式逐渐成为制约数据中心发展的关键因素。运营者希望对数据中心进行集约式的建设和管理,实现数据中的绿色节能和智慧高效。
云计算、大数据和物联网等新一代信息技术的蓬勃发展,为实现数据中心基础设施集约化、智能化的建设和管理带来了新思路。
2 数据中心基础设施管理现状
数据中心基础设施管理的价值在于为应用系统提供一个安全、有效的支撑环境。在很多企事业单位信息化建设的背后,基础设施运维管理的疏漏,已经随着数据中心的发展继续扩大。
(1)系统复杂性攀升,管理效率低下。添加一台服务器,运维人员需从冷量、功率、空间等多方面来衡量和考虑服务器的安放位置;对于机房中不断变化的冷量和功率需求,依靠人工测量和感知很难及时把握,且不能对这些变化做出快速及时的响应,导致管理效率低下。
(2)高密度向电源和制冷系统施压,可用性受到威胁。高密度能耗机架需要明智且高效地分配昂贵的电源和制冷资源,运维人员需了解布局才能有效地利用容量;高密度和动态负载情况,又为电源和制冷带来了不可预期的风险,一旦电源或制冷过载,造成基础设施服务中断,可引发连续的IT设备故障,仅依靠人工手段,难以对过载情况进行预警。因此,数据中心可用性无法得到保证。
(3)资产利用率难以提升。造成资产利用率难以提升的原因有两个:一方面是由于运营商没有对数据中心安全性和可用冗余度等级进行定义并按照约定执行;另一方面是没有对数据中心资产进行定期盘点,造成资产在用情况和储备情况不明。数据中心资产非规范化的管理存在很多隐患,利用率低只是其中之一。
3 智能化平台在基础设施运维中的应用
数据中心基础设施智能化运维平台,是以资产+数据为核心,从人、资源、应用三种管理视角出发,实现可知、可见和可控的新一代IT基础设施数字化、精细化管理的支撑平台。结合物联网技术,通过智能传感设备,按照约定协议,将数据中心基础设施连接到信息网络中,实现基础设施和管理平台的信息交换;同时,运用大数据和云计算技术,实现对海量监控和运维数据的快速分析计算和利用,发掘数据背后的挑战与机遇,实现对数据中心基础设施更加精细和智能的运维管理。