安特泰智慧机房-IT微环境筑基绿色安全的智慧数据中心

一、IT微环境监控的实现

IT微环境是指最靠近IT设备存在局部差异性的真实运行环境,从与IT设备运行相关性角度出发,包括但不限于温度、湿度、柜门状态、电压、电流、负载、气流、火灾、空间占用等。

传统的数据中心环境监控是基于机房远离设备的,其常规做法是在机房部分区域的墙壁上安装温度传感器,在机房顶部、地板下方安装烟感与温感探测器,在配电柜侧安装智能电量仪和空开状态监测仪。这些监控以机房为监测对象,并不能反映机柜之间的差异。  

IT微环境是基于机柜的局部环境,最贴近设备的真实运行环境能够体现机柜之间的个体差异性。这些个体差异性共同构成了机房整体细节,包括温度的分布、湿度的分布、能耗的分布、空间的分布等。

1、设置阈值与告警

大量传感器的使用让数据中心管理者能够实时了解IT微环境的情况同时也提供了灾害预警的手段引发IT微环境异常的因素多且不可控,但这种异常可能带来的故障与灾难性后果是可以预期的通过设置上下限阈值,一旦发生突破安全阈值的情况,系统将及时通知管理者,使管理者能够第一时间发现异常,并采取措施消除异常,排除隐患,从而避免发生严重后果。

不同的阈值与告警级别对应着不同的应急机制,管理者能够通过规范的流程和策略来处理不同级别的告警,做到忙而不乱,从容不迫。

2、温度传感器部署

温度传感器是IT微环境监控的重要传感器之一数据中心管理者通过温度传感器来了解制冷系统的实际效果,也用来确保IT设备正常换热的冷气温度是否符合要求。数据中心由于机柜内设备密度的不同和发热量的不同而产生局部热点,这些热点主要反映为机柜不同位置的进风温度。

温度传感器的部署位置越贴近设备越准确根据ASHRAE(美国采暖、制冷与空调工程师学会)的建议,标准42U机柜在冷通道(即进风侧)安装3个度传感器,分别位于顶部、中部和底部。更高密度的传感器将更准确的反映温度情况。

位于机柜后部的温度传感器采集到的温度是热通道(即出风侧)的温度同样有助于了解数据中心的温度分布。同时,过高的出风温度也意味着设备的异常发热,也是需要引起管理者警惕。机柜后部的温度传感器阈值应当高于机柜前部的温度传感器。

3、非法使用与柜门状态监测

作为数据中心管理合规性的一部分机柜的使用有严格的计划性和监督要求。但鉴于庞大且密集的机柜数量,且同一机房内的机柜往往外观非常相似,在寻找机柜对象的过程中,经常发生误开情况,特别是在同型号设备众多的情况下,还会发生操作设备错误的情形,尤其是一些核心关键设备,这种错误操作往往是致命的,容易引发灾难性后果

借助于机柜电子门禁,能够很好的避免类似情况的发生。维护人员在开展设备维护操作前,管理员通过管理软件对指定机柜电子门禁进行授权,在操作时就维护人员无论是持有门禁卡,还是通过指纹或人脸等生物特征,均只能开启指定机柜,避免其越权操作。管理软件同时能够对机柜开启和关闭操作进行记录,方便后期的查询。同时,机柜电子门禁可配套开门拍照摄像头,实现对开门人员身份的二次记录和确认,并可用于事后的审计追溯。机柜电子门禁的授权方式是灵活的,可以按角色、时间、次数、机柜等进行限制,确保机柜使用的受控。

柜门状态的监控也是必要的。长期常开的柜门,不仅仅影响数据中心的规范性,同时带来不安全因素,将IT设备及线缆暴露在外部,还阻碍人员与设备移动。柜门状态的监控是通过在机柜安装门状态传感器来实现。

4、负载与能耗监测

数据中心管理者需要关心每个机柜或者每条电路的负载及能耗情况,一方面避免发生电路过载情况,另一方面也可以作为计费的依据。电路过载通常由IT设备上架、设备故障、设备超负荷等情况引起。一旦发生电路过载跳闸,将引发整个机柜断电,造成整个机柜的IT设备宕机。

使用智能PDU是实现机柜负载和能耗监测的快捷途径智能PDU可以监测每PDU甚至每个PDU输出端口的电压电流和负载

5、气流监测

除了冷风的温度外,冷风流量也是影响IT设备换热效率的主要因素之一。在采用地板下送风的数据中心,地板下方形成送风冷气的静压箱,再通过通风地板将冷风送到每个机柜。地板下方同时还是主要的线缆布放路径,大量的强电线缆和弱电线缆敷设在地板下方,线槽高度超过了地板下方空间高度的一半以上,这些线槽对冷风气流组织造成阻碍,严重影响送风的效率。随着数据中心使用时间的延长,一些新增的线缆不能规范的安装,路径混乱,旧的线缆不能及时撤除,加剧了对气流的阻碍。

安装在机柜的气流传感器可以监测跟踪进风气流的变化,管理者可以根据气流数据对气流不足的位置进行优化满足IT设备换热的需要

6、资产管理与空间容量监测

资产管理与空间容量监测对于机柜空间合理使用具有积极作用通过监测IT设备类型用途与安装位置并配合机柜负载的监控管理者在选择新的IT设备安装位置时能够选择设备类型用途相近并具有负载余量和空间余量的机柜进行设备安装。这样,既方便捋清网络结构,又实现了单个机柜的空间使用率的最大化,IT设备在数据中心的安装布局更加科学、合理。空间容量监测同时能够提前发现空间不足,为机房扩容提供预警和参考。

为实现对空间容量的自动监测,可以采用设备自动定位设施设备自动定位通过电子标签来实现依据原理和形态可分为线与线两种方式。无线的方式是采用无线标签,主流的是RFID标签。无线方式不能对IT设备在机柜内部安装U位进行定位,只能监测到设备在哪个机柜。这种方式并不能很好的满足精确性的要求。有线的方式采用的是接触式电子标签,定位装置与机柜的U位置一一对应,从而可以准确的定位设备所在的U位。为实现这种准确定位,每台IT设备都粘贴有电子标签,每个机柜安装有定位装置。

电子标签代表了IT设备的身份信息,通过软件能够很方便地查询该设备的资产信息、使用信息和安装位置信息。

7、火灾探测

传统的数据中心的火灾探测是通过安装在吊顶内部吊顶下方地板下方的烟感探测器和温感探测器来实现。如果机柜内部设备起火,短期内很难能够发现,只有在火势蔓延到机柜外部,烟感与温感同时告警才能够启动自动灭火系统进行灭火。这个过程往往距离起火已经过去了10分钟以上时间。

在机柜内部安装烟感探测器距离设备很近在设备起火初期就能够发现火情启动自动灭火装置灭火。提前510分钟的时间灭火,足够挽救大量的IT设备减少时间

二、建设绿色数据中心

1、节能减排大趋势

绿色数据中心的核心是最优的能源效率和环境保护。在日益严峻的全球变暖形势下,减少碳排放是所有企业应尽的责任和义务。PUEPower Usage Effectiveness,数据中心消耗的所有能源与IT负载使用的能源的比值)是评价数据中心能源效率的指标,是数据中心消耗的所有能源与IT负载使用的能源之比,越低的PUE代表了越高的能源效率。国家推荐标准《GB/T 32910.3-2016 数据中心 资源利用 3部分:电能能效要求和测量方法》中,根据EEUE值(Electric energy usage effectiveness,数据中心总电能消耗与信息设备电能消耗的比值,等同于PUE)将数据中心电能能效分为5级,表现出对节能降耗的重视。此标准在充分结合我国国情的基础上,为补偿系统差异考虑数据中心采用制冷技术、使用负荷率、安全等级、所处地域不同产生的差异而制定了能耗效率值调整模型。经调整后EEUE低于1.6的数据中心为“节能”等级。标准的出台,同时也为绿色数据中心建设提供了指导。

数据中心作为耗电大户,有效的节能降耗对于保护环境具有重要意义。能耗

成本往往占数据中心总体运营成本的60%。以安装1000个机架的数据中心为例,假使单机柜功耗3kWPUE1.8则全年用电量4700kWh若电费0.85/kWh,全年电费支出高达4000万元,成本巨大。如果将PUE降低0.1,则全年可节省用电260kWh,节约电费220万元。数据中心节能降耗效益十分可观。

2、数据中心常规节能手段

为达到最优的数据中心电能效率,可以从提高空调能效、优化热交换效率、提高UPS效率等方面进行改进。

在数据中心总耗能中,空调能耗占比通常可达到40%。提高空调能效也是当前主流的节能降耗手段。提高空调能效的方法包括采用变频压缩机和变频风机以及采用水冷空调代替风冷空调或者综合使用自然冷源冷却等。通过这些手段,可以节约空调能耗平均达到36%,使用自然冷源冷却的,空调系统节能可达40%~65%³

热通道/冷通道封闭是将机柜之间的热通道或冷通道进行封闭的应用方式,可以有效隔离冷热空气,减少冷气的环境损耗,提高换热效率。模块化数据中心在冷通道封闭的基础上,采用行级空调,直接对冷通道送风,缩短送风途径,进一步减少冷气的环境损耗。通过这些手段,可以节约30%以上的空调耗能。

UPS系统会产生电能损耗,常规的UPS整机效率约为90%,负载越低,效率也越低。UPS系统通过新的节能技术应用,可以将整机效率提高到95%以上,减少UPS自身的电能损耗。应用现有的节能技术,配电系统平均节能可达18%4 

以上措施是建设绿色数据中心的主流手段对于节能降耗和提高PUE效果显著能够将数据中心PUE降低到1.5以下。但这些措施是否已经得到最合理的使用和配置?这就离不开对IT微环境的监控,来对实际效果进行测量和评价。

3IT微环境监控补上短板

能耗计量是数据中心重要的节能基础性工作,据针对特定领域的抽样调查,只有31.6%的机房有分项计量,30.1%的机房只有整体计量,38.3%的机房没有计量。对数据中心节能降耗措施的效果评价需要有准确的数据作为依据包括对IT微环境的跟踪和PUE的测量和计算等这些监测是必不可少的

IT微环境监控可以监测每个机柜的微环境体现整体数据中心的局部环境差异性。数据中心应用了各种节能降耗手段后前提条件还是需要满足IT设备的运行环境要求并依据这些IT微环境监控信息对空调等进行调整和配置,以达到最优效果。

IT微环境监控也是DCIMData Center Infrastructure Management,即数据中心基础设施管理)软件系统的重要组成部分,成为基础设施管理的一环,直观的展示整个数据中心的环境与能耗情况。

2.4基于IT微环境的节能手段

IT微环境监控对于数据中心的节能降耗具有指导与促进作用依托IT微环境监控可以更好的发挥节能降耗措施的效果主要有以下几个方面的作用

Ø 指导空调温度设置

数据中心管理者对于空调温度的设置通常都是依据经验过度制冷普遍存在。根据《电子信息系统机房设计规范》(GB50174-2008)要求,AB级机房的温度范围为23℃±1℃,及IT设备的最高进风温度为24℃。然而实际上,为了避免局部过热,大部分数据中心设置的空调温度大大低于该温度,多数都在22℃左右,甚至低于20℃。许多情况下,这是没有必要的,不一定存在局部过热风险。

美国供暖、制冷和空调工程师协会(ASHRAETC 9.9技术委员会作为数据中心领域的权威组织,发布了《2011数据中心处理环境热指标——扩展数据中心和使用指导》。其中,对于数据中心给出了27℃上限的推荐温度范围。

根据指导,数据中心管理者依据此可以尽量提高空调的温度设置,既能够满足IT设备运行要求,又能够极大的降低空调能耗。

空调设置温度的提高意味着能耗降低。根据Intel的报告,每提高空调温度1℃,能够节省7%的空调能耗。对于PUE1.8的数据中心,如果空调设置温度提高2℃,将带来0.1左右的PUE降低。IT微环境监控,可以为这种调整提供准确的测量和依据,指导空调温度设置。

Ø 指导设备安装位置选择

IT设备安装密度与功耗是造成数据中心局部过热的主要因素,而局部过热又意味着需要更低的空调温度设置和更高的空调能耗。数据中心管理员在新设备上架时,习惯于根据机柜空闲空间情况或者按顺序选择机柜位置,但这种选择并不合理。设备安装位置的选择需要根据机柜空闲空间情况、设备在网络中的位置、机柜负载情况、机房温度分布、冷气风量分布等因素综合确定。

IT微环境监控提供了机柜空间容量机柜负载机房温度分布冷气风量分布等实时数值,依据这些监控,能够让设备安装位置的选择更合理、更高效。

Ø 实现自动气流调节

当数据中心局部过热不可避免时单纯的降低空调温度是一种低效的做法。在不改变设备位置的情况下,调节冷气气流则是另外一种更有效的方案。调节气流组织,主要是调整进入机柜的冷风风量,以加快设备的热交换,加速散热。调节气流的手段包括机柜风扇、可调通风率的通风地板、配置风扇的通风地板等。

这些调节气流手段在使用时必须与IT微环境性匹配,并监督其效果,否则容易顾此失彼,形成新的热点。结合IT微环境监控,具备电动控制装置的气流调节设施可以实现与IT微环境的联动,自动在热点区域启动气流调节设施,改善气流,消除热点。

气流的调节具有系统性,需要持续监控整个机房温度分布的变化,配合软件算法,可以实现系统地联动,以达到整个数据中心温度分布的均衡性。

Ø 为节能改造提供参考和验证

在数据中心投运初期,环境基础设施留有较多的余量,环境比较好。但随着使用时间延长,各种环境问题逐渐暴露出来,PUE也居高不下。在这种情况下,企业出于节能降耗、优化环境的需求下,需要开展节能改造。

IT微环境监控可以给数据中心节能改造提供参考数据定位问题所在。例如:根据能耗情况,淘汰低能效的老旧设备;根据热点分布,优化气流组织;根据温度分布,合理选择新增空调安装位置;根据空间、电力使用趋势,及时进行机房扩容;等等。

同样,在对机房或数据中心进行节能改造以期达到降低PUE的效果时,如何验证改造措施的有效性,就成为新的问题。采用IT微环境监控系统,还可以对节能改造后的实际效果提供精确的反馈数据,包括精细的微环境多点温度的历史变化对比,能够非常直观的反应出节能改造的效果。

三、建设安全数据中心

关于数据中心安全的重要性是毋庸置疑,常规的安防系统为数据中心提供了必要的安全防护功能。但这些手段还不够。根据数据中心性能研究机构纽约正常运行时间学会(Uptime Institute)分析了4500起数据中心事故,其中人为失误引发了大约70%的数据中心故障。机柜是保障设备物理安全的最后一道防线,打造安全受控的机柜级安全控制能够有效弥补安全漏洞。

1数据中心典型不安全因素

大型数据中心依据设备的重要程度,往往会分为几个不同的安全区域,对于关键的核心设备有更高的安全性要求。在数据中心日常使用与管理过程中,只重视进入机房人员的身份核实与权限管理,一旦进入机房就很难再对人员进行跟踪,而一些情况下,厂家、租户等外来人员也会进入机房对设备进行维护。在这个过程中,一些人员有意或无意情况下会开启不相关的机柜,带来敏感信息泄露及其它安全风险。

此外在日常新设备上架过程中管理者往往根据个人经验估算机架的负载情况。估算过高,会造成机架空间的极大浪费;估算过低,新设备上架会引起电路跳闸,引发整个机架的设备宕机,后果严重。

绝大多数的人为错误并不是有意的行为,可能只是人们在不经意的时候碰了一个按钮,或者将不小心将线路缠在了一起,而这些不经意的动作往往会产生灾难性的后果。

2机柜级准入控制

在机柜上安装电子门禁锁是实现机柜级准入控制的有效手段电子门禁锁通过控制器进行权限校验和柜门开启操作结合监控软件,可以根据卡号、角色、账号、时间、机柜等进行授权,并对每次开门操作进行记录。必要时,配合摄像头,可以实现开门拍照与人脸识别验证等。

机柜电子门禁锁的使用有助于帮助数据中心管理者严格控制机柜的使用,严格的授权管理可以有效避免机柜误操作和设备误操作。特别是对于关键核心设备,提供了最后一道安全防护。管理者通过将机柜授权与ITIL(Information Technology Infrastructure Library,信息技术基础架构库)运维管理系统相结合,可以跟踪运维工作任务的执行时间,避免计划外的机柜开启。

机柜级准入控制可以提供审计功能调查机柜使用情况追溯事故的责任人等

3机柜级能耗管理

引发数据中心分支电路跳闸的原因有几个方面IT设备上架、设备故障、设备超负荷等。IT设备上架时,如果对机架负载估算错误,就有可能发生电路超载。而这种估算错误又是很难预见的,这种情形成为电路跳闸的主要原因。设备故障引发跳闸的故障比较少见,现在的设备多数都有保护电路,以避免产生大电流。设备超负荷的情况时有发生,主要是在设备CPU使用率提高引起功率变化。

对机架的能耗监测与管理可以避免分支电路跳闸的发生精确的电路实时负载可以帮助管理者预见风险并发出告警

四、建设智慧数据中心

当前,智慧城市的建设正如火如荼的展开,出现了众多细分领域的智慧应用,如智慧交通、智慧医疗、智慧社区等等,其中在数据中心领域,建设智慧型的数据中心也成为数据中心的发展趋势。智慧数据中心实现了数据中心的建设和运维实现从僵化到柔性、从粗放到精细、从主要依赖人工到自动化的全面转变。

数字化、网络化与智能化既是“中国制造2025”的核心特征,也是智慧数据中心的核心特征。“数字化”使系统可视可管,数字化实现器件级、部件级、系统级的可量化可感知,让数据中心简单易管,所有设备信息尽在掌控。“网络化”实现高效运营,实现节能降耗,实现全网数据中心多层级、精细化能耗管理,构建绿色数据中心;实现最佳资产管理,全网资产的全生命周期管理;容量最优,全网数据中心配电、制冷、空间的精准监控,保障系统容量的三项平衡。“智能化”实现系统自动管理和维护,实现统一、智能管理,满足大容量监测的需求,并提供大数据分析能力。

1智慧的基础设施

在数据中心基础设施层面实现智慧数据中心离不开智慧的基础设施支持。基础设施作为一个整体的系统,其智慧内涵包括了状态感知、系统联动、智能调节等方面。大量传感器的应用不仅仅能够感知精密空调UPS机柜等设备设施更详细的运行状态感知温度湿度能耗空间气流等环境细节,不放过任何一丝具有威胁的变化。物联网网关、自动化技术和软件系统通过共同作用,对于感知到的异常情况可以根据预先设置的策略采取联动措施,比如自动调节空调温度设置、自动启停气流调节设施、自动关闭设备电源等来改善环境,减少危害蔓延。智慧的基础设施是一个高度自治的系统,无需人工干预更加及时高效

2大数据分析与预测

智慧数据中心实时感知各类基础设施和环境的状态这些参数365*24小时不断的采集,积累了海量的数据。这些数据蕴藏着周期与规律,大数据分析工具能够透过海量的数据找到这些周期、规律与关联性。大数据分析可以帮助我们快速定位问题和故障,扫除干扰数据;利用科学的算法,可以预测一段周期内的参数发展规律,对可能发生的异常与风险进行预警;可以形成可视化的图表和统计分析报告,辅助数据中心管理者进行决策。

3可视化管理

可视化是智慧数据中心的监控管理基本要求。数据的呈现不仅仅只是数字,而是可视化的状态。3D展示是这种可视化的最佳效果,虚拟的三维数据中心结合具体基础设施状态,管理者可以直观的掌握整个数据中心的环境分布、空间分布、能耗分布、气流状况等,并突出显示威胁位置和告警信息。

良好的可视化设计提高了软件的互操作性,避免管理者的视觉疲劳,并容易学习软件操作习惯。可视化是软件效率的体现。管理者看到的是经过处理的结果而不是原始的数据,从而直接抓住重点,避免干扰。

4安特泰(ANTM)构建智慧数据中心基础

IT微环境监控的传感器安装对于智慧数据中心来说是个难题。独立安装IT微环境监控设施结构分散,部件零散,布线困难。因此将传感器与机柜结合是必然的结果。

机柜是智慧数据中心的重要基础设施。安特泰ANTM)智慧机房解决方案以智慧机柜为核心,将机柜变为可管、可控的智能设施,融合了物联网应用、自动控制技术、ICT、软件技术,集成了智慧数据中心的IT微环境监控、IT设备定位、机柜安全控制、远程监控管理的功能,为构建智慧数据中心奠定基础。配合CEMS监控软件,提供对数据中心IT微环境直观的在线监测,满足智慧数据中心管理需求。

安特泰ANTM)智慧机柜是一体化的机柜系统,各项功能有机整合,安装与使用符合数据中心的管理特点,符合有关标准规范的要求。可以使用在常规数据中心、热通道/冷通道封闭数据中心、模块化数据中心等场合,并且向通道和房间整体动环监控方向扩展,实现完整的数据中心基础设施监控管理。

安特泰ANTM)智慧机柜也是开放的设施,支持与第三方系统进行对接,可接入动力环境监控系统、3D展示系统或DCIM系统统一管理,并且还能与其他各类数据中心应用系统结合,提供更为强大的数据中心综合管理功能,打通从底层基础设施到顶层应用系统的完整数据链,进一步挖掘数据中心的下一个经营管理增长点。