数据中心机房技术日期:2011.4.6刘志国/01004数据中心介绍数据中心各系统数据中心评估服务案例与测试目录数据中心介绍数据中心的重要性数据中心的标准及规范数据中心面临的挑战数据中心各系统数据中心评估服务案例与测试目录数据中心的定义究竟何为数据中心?有人说:数据中心是大量数据处理集中的网络有人说:数据中心是集中网络、计算、存储的平台,是超级计算机有人说:数据中心是企业的命脉实际上:数据中心是企业ICT的基础,是企业战略成功的基石UNIXNTServersMailframesSystems企业发展R&DSalesP&MTSCMKTPRINTSERVICEMailSERVICENetworkSERVICEPMSSERVICESite/roomhubroutersSwitchesnetworkOrganizationsServicesInfrasturatureFacilitiesStragicEPMSoracleOAApplicationsERPServiceElectricalEnvironmentFireSuppressionmembers数据中心的定义数据中心的重要性数据中心是ICT(信息通讯技术)的基础,从而也是公司战略成功的基石数据中心宕机会对企业运作有重大影响(MissionCritical)数据中心故障的来源人为操作故障错误的操作和流程规范未授权访问事故、忽略警告造成进一步故障电源质量问题异常电流、电压、频率问题电源干扰、高地阻、电源谐波电磁问题线缆、电源、变压器、PDU、雷电等辐射环境因素温、湿度问题错误制冷污染无法预防的(33%)*可预防的(67%)*•人为过失•缺少流程•错误的程序•差的设计•不充分的冗余•维护•设备故障(尽管有适当的维护和测试)•供应/服务链故障•电脑恐怖行动数据中心宕机的根本原因数据中心介绍数据中心的重要性数据中心的标准及规范数据中心面临的挑战数据中心各系统数据中心评估服务案例与测试目录•国外标准:•国外标准《TelecommunicationsInfrastructureStandardforDataCenters》、ANSI/TIA-942-2005、ANSIEIA/TIA568A、569、607美国布线标准等。•国内标准:•GB2887《电子计算机场地通用规范》•GB9361《计算机场地安全要求》•GB50174《电子信息系统机房设计规范》•GB50462《电子信息系统机房验收规范》没有公认全球统一标准,通过一些最佳实践指导数据中心建设机房标准数据中心分级TierI基本TierII冗余单元TierIII可并行维护TierIV容错可用性99.671%99.749%99.982%99.995%每年IT服务中断时间28.8小时22.0小时1.6小时0.4小时操控中心无无有有多运营商线路接入否否是是主干线缆冗余否否是是水平配线冗余否否否可选供电线路1路1路1主+1备2路热备UPS冗余NN+1冗余N+1冗余2N冗余……注:数据中心的定级取决于整个系统中最低等级的部件数据中心分级(TIA-942)数据中心机房建设规范--ANSI/TIA-942标准概述ANSI/TIA-942标准,《TelecommunicationsInfrastructureStandardforDataCenters(数据中心的电信基础设施标准)》,是美国通信工业协会(TIA)、TIA技术工程委员会(TR42)和美国国家标准学会(ANSI)在2005年4月发布的以数据中心通讯基础设施(机房工程)为对象的技术规范标准。TIA-942的适用范围:企业数据中心(EDC)、互联网数据中心(IDC)TIA-942的目标(PurposeofTIA-942):•填补数据中心通讯基础架构设计标准的空白。•为数据中心的用户提供了数据中心设计方面的关注点,以便客户可以更好的同建造数据中心的工程师、建筑师们沟通需求。•设立一个数据中心建设等级标准(主要是可靠性、安全性)。•发布这个标准也为了带动数据中心网络通信设计人员,数据中心的IT从业人员能更早的投入到数据中心的早期设计阶段;•确保数据中心能适应于各种设备和实施工艺的需求:–保证数据中心有充足的铺设电缆的管路(管道、通道、线槽);–保证数据中心有充足的电信设施扩展空间;–保证数据中心各种电缆的长度符合通信应用的要求;ANSI/TIA-942标准概述发布TIA-942的目的(续):•定义数据中心通讯基础架构的标准:–使用标准的架构和截止(电缆)来实现数据中心架构化布线系统;–适应于多种通讯设施的部署(LAN、SAN、WAN、Channels、Consoles,楼宇自动化系统);–可适应现在和不远的将来的各种通信协议的部署(10GE、10G);–代替那种非结构化的通过不同电缆实现不同通信系统间联系的布线方式;–实现数据中心电信空间和电缆铺设的标准化;–提供为数据中心各种电缆、配线架、机架做编号、标签的建议接入室RM接入服务商网或园区网总配线区MDA水平配线区HDA设备配线区EDA主干电缆水平电缆通信室TR机柜机柜机房ComputerRoom机柜机柜机柜机柜机柜机柜MDAEDAEDA典型数据中心布局EndofRow:比较传统的布线方式.网线直接从服务器拉到汇聚/接入交换机这种方式面临着服务器群接入密度的挑战:从最远端机架到列头柜的距离比较远,网线拉的比较长每排机柜的数量由于列头柜上接入交换机的端口密度限制而有限制特点:比较典型的应用是在机架是交换机做接入网线在机房建设的时候就铺好了每个服务器机柜6-12服务器。每个服务器机柜4-6KW。每个网络机柜10-20KW。每台交换机上有多个VLAN/子网;数据中心的接入交换机设备数量少,管理维护方便端口可扩展性较差接入层形态——End-Of-Row接入层形态——Top-Of-RackTopofRack:这种组网一般用在大量IRU服务器接入的机房一般是每个机架上放一台接入交换机,但有时候根据具体情况也会放多台(还可能堆叠)通常是每机柜15-30台服务器布线:•机架内的服务器拉网线到机架内的交换机上•上联汇聚交换机的链路可以是铜缆双绞线(CAT5E,CAT6),也可以是光线(GE/10G),建议用光纤(易扩展)。子网和VLAN问题:•可以在一个接入交换上部署多个VLAN/子网,但通常每个交换机上的VLAN/子网较少。•网络端口的可扩展性好数据中心衡量指标能源使用效率:PUE(PowerUsageEffectiveness)总输入功率=基础设施功耗+输出到IT设备的功耗PUE=1+基础设施功耗÷输出到IT设备的功耗PUE最小为1,越接近于1越好。美国PUE平均为2,新建IDC要求在1.6以下。我国PUE平均约为2.6。微软某数据中心PUE为1.2。数据中心基础设施效率:DCiE(DataCenterinfrastructureEfficiency)机柜功率密度:PPR(Powerperrack)机柜功率密度(IT总功率/总机柜数)一般情况每机柜功率密度3kW;冷通道封闭,每机柜功率密度由3kW升至6kW总拥有成本TCO(TotalCostofOwnership)TCO=初期建设成本+生命周期内总运行成本举例:机房1:初期建设成本200万,PUE=2.4(低效)机房2:初期建设成本250万,PUE=1.8(中效)机房3:初期建设成本300万,PUE=1.5(高效)MTBF(MeanTimeBetweenFailure)MTBF=MTTF+MTTR高的SLA级别数据中心介绍数据中心的重要性数据中心的标准及规范数据中心面临的挑战数据中心各系统数据中心评估服务案例与测试目录数据中心面临的挑战和未来发展方向•挑战–管理混乱:管理复杂度不断提升–能源消耗:数据中心能源消耗•未来发展方向–绿色从建筑材料、设备制造材料、整体能耗上体现未来数据机房建设的绿色理念。–节能节能从多个方面体现,如降低能耗比,设备降低能耗、建筑物、机房装修等多方面体现。数据:美国2006年数据中心电力消耗占全部电力消耗1.5%,预计到2011年达到2.9%。–智能各种系统能有机的联系在一起,实现机房的自动化程度。绿色数据中心:能量流动图Chiller33%Humidifier3%CRAC9%ITEquipment30%PDU5%UPS18%Mainswitchgear/Generator1%Lighting1%WasteHeatOUTWasteHeatOUTINDOORDATACENTERHEATINDOORDATACENTERHEATElectricalPowerINElectricalPowerIN制冷系统IT系统供电系统集成集装箱解决方案!微软“第四代”数据中心--芝加哥数据中心每个集装箱内可封装了2500台服务器,最多可到4200台服务器数据中心-解决方案(美国)未来智能化数据中心机房数据中心介绍数据中心各系统电源系统█地板冷却系统■布线选址■消防及安全布局■防雷机柜■照明数据中心评估服务案例与测试目录23UPS供电系统数据中心的供电系统电源系统UPS供电系统主要设备供电系统,供电质量要求高,必须采用UPS不间断电源供电包含UPS电源、电池组、电源切换器STS/ATS等辅助设备如空调设备、动力设备、照明设备、测试设备等使用其他电源系统后备供电系统后备电源系统,使用柴油机(组)发电机等设备保障备用供电UPS供电参数以VA计算:例如300kVA;小型UPS房间可与主机房在一个房间,一般大于100kVA的UPS要有独立房间电源系统接地电阻应该要小于1欧姆,不大于5欧姆所有金属器件都要接地一般超过20ms的电源中断,会导致设备掉电电源质量的主要危害研究表明,非常多的设备故障来自于电源不稳定,这些故障主要有:键盘故障、系统锁死硬件可用行下降设备损坏不可恢复的文件损坏用户花费大量的精力试图恢复这些最终不能查出原因的故障。市电电源主要问题中断(powerfailure):指市电中断并且持续至少两个周期到数小时的情况,主要由:线路上的断路器跳闸、市电供应中断、线路中断等引起。电压突降(powersags):指市电电压有效值介于额定值的80%至85%之间的低压状态,并且持续时间达一个到数个周期,主要由:大型设备开机、大型电动机启动或大型电力变压器接入等引起。电压浪涌(powersurges):指输出电压有效值高于额定值110%,而且持续时间达到一个或数个周期,主要是由于在电网上连接大型设备关机时,电网因突然卸载而产生的高压。电压起伏及闪烁(brownout):指市电电压有效值低于额定值,并且持续较长时间,其产生原因包括:大型设备启动和加载、主电力线切换、启动大型电动机、线路过载等。脉冲电压(highvoltagespikes):指峰值达6000v,持续时间从万分之一秒至二分之一周期(10ms)的电压,主要由于雷击、电弧放电、静态放电或大型设备的开关操作而产生。频率变化(frequencyvariation):指市电频率的变化超过3HZ以上,原因为:应急发电机不稳定运行,或由频率不稳定的电源供电所致。杂波干扰(noise):指射频干扰(RFI)和电磁干扰(EFI)以及其他各种高频干扰,如马达的运行、断电器的动作、马达控制器的工作、广播发射、微波幅射以及电气风暴等。市电电源主要问题解决设备•稳压电源•隔离变压器•飞轮稳压装置•发电机•ATS•STS•UPS•隔离变压器的主要作用是:使一次侧与二次侧的电气完全绝缘,也使该回路隔离。抑制高频杂波传入控制回路。•性能良好的UPS可提供非常准确的电压稳定度、频率稳定度,能基本解决市电电源问题UPS分类•按输入输出方式可分为–单相输入/单相输出–三相输入/单相输出–三相输入/三相输出•按容量分类–小功率5KVA以下–中功率5KVA-30KVA–大