详解数据中心的管理

责任编辑:sjia

2011-10-20 10:25:00

施耐德 IT事业部大中国区数据中心 管理平台销售总经理 赵明浩 详解数据中心的管理。

企业网领域的第1标杆会展 - 2011 秋季CENCE 中国企业网络通信大会暨展览(含云计算高峰论坛,企业通信高峰论坛两大金牌论坛)进入第二天。作为国内企业网/云计算领域最高

端, 影响力最大的会展,本次活动约有三千名来自IT主管,运营商,渠道代理和厂商的专业人员出席,约150家媒体参与报道。大量来自金融保险医疗教育等行业的CIO分享真实的

ICT和云计算案例。60多家国内外知名厂商在“两会一展”的平台上展示了其最新的产品及解决方案,吸引了众多线上线下观众的关注。

知名厂商“施耐德 ”亮相“两会一展”并发表精彩主题演讲,其演讲主题为“详解数据中心的管理”。以下是现场快递。(声明:本稿件来源为现场速记,可能有笔误和别字,谨供参考)

主持人:

感谢严总带来的精彩演讲。如果将数据中心比作一个舞台,而云计算虚拟化是舞者,只有搭建一个绿色高效的数据中心,才能让云计算和虚拟化技术完成美丽的舞蹈,下面我们有请施耐德专家通过情景演示的方式给我们详解数据中心的管理。他们是施耐德IT事业部大中国区数据中心赵明浩以及管理平台销售总经理王小娟。大家掌声欢迎。

赵明浩:

我们都知道施耐德电器一直是全球能效管理专家,施耐德有整套解决方案,从整个厂区,整个楼宇然后调到楼宇里边的数据中心都有非常完整的解决方案。今天我们只是介绍数据中心管理软件这款产品。

我们都知道最近几年数据中心的变化一直都很快,从08年绿色概念的导入到09年虚拟化技术的引用,到数据中心,一直到最近几年叫的非常响云计算的概念。这些变化和一些新技术、新概念的引入使数据中心管理变得越来越复杂。我们这里有一份报告是来自于Gartner,普通CIO都认为由于设备的增加,数据中心空间、供电和制冷将会成为未来几年最大的挑战。

面对这种挑战,面对这种新技术,像一些大公司有责任,也有义务去开发出新的解决方案,新的产品来应对这种变化,这种挑战。就像我刚才说的施耐德一直致力于对我们的客户,对我们最终的用户提供最完整的解决方案,我们把传统IT和传统能源自动化有效的结合在一起。从目前来看只有我们能做到这一点。这种将IT和传播能源自动化结合起来,可以更好地帮助我们的用户来管理他们的数据中心,提高我们数据中心的效率。

下面我们来看看施耐德,红色的那一层是我们关注的地方,我们关注的是数据中心物理基础设施的管理,其中包括供电、制冷、安全环境。同时我们这个解决方案可以有效的打通物理基础设施和IT硬件平台,在以前这两者之间是没有信息交互的。同时我们的解决方案可以和现有的解决方案做无缝的集成,比如说对我们上层,企业管理系统,对下层都可以做到完美的无缝集成。

全球范围内有两家非常知名研究机构对我们产品的评价,其中之一是来自于451group,他们认为施耐德电气解决方案成为这一领域无可争议的领导者。我们可以看到这是一份非常有趣的报告,他们认为DCIM工具将来会在数据中心管理上成为一种主流,而且他的使用率仅仅只有1%,会迅速增长到2014年的60%。也就是说我们可以看到数据中心管理层面来说的话,需求是非常大的,当然其中也包括我们中国。

从解决方案的业务收益来看,我们可以看出来451认为如果一个数据中心没有DCM的管理很难把它的管理水平上升到很有效,很高的水平。同时Gartner良好的数据中心,特别是能效管理方面可以降低运营成本达到20%,这是非常可观的数据。同时我们施耐德典型的方案,我们的投资回报期通常小于12个月。

下面我们来看一下施耐德公司这款产品在全球范围内,在各个领域一些成功的案例。这里我会举四个例子,第一个例子是我们国内的一家通讯服务供应商,对这家公司来说采用我们的产品之后CIO可以花更多的钱在数据中心建设上。我们可以换一个角度来考虑这个问题,数据中心通常管理下是被动的,就是当我们的数据中心物理基础设施出现问题的时候我可以监控的到,可以监控到之后再解决这个问题,运维成本自然很高。如果我们把这种被动的管理方式改成主动的,在没有出现任何问题之前可以做一些预测,做一些保护的话,我的运维成本自然降低。当整个投资是一定的时候,运维成本在下降,建设成本就更多,我可以买更多的IT设备。

第二个例子是来自一家全球领先的金融机构,它采用我们的数据中心解决方案之后,在他现有的数据中心发现了有很多的搁浅容量。我不知道大家对搁浅容量是怎么理解的,简单的知道这部分容量没法使用。用户识别出搁浅容量,并把这些搁浅容量恢复成可用的容量。有可能机柜智能不够了,供电不够了,网络接口不够了。也就是说这部分能量是花钱的,但是确实没法使用。通过使用我们这个软件之后,我们可以发现在数据中心里边有大量的搁浅容量,我们帮它发现,同时把搁浅容量释放出来,成为有用的能量,使他们的数据中心使用寿命延长三年。

第三个例子是来自于一家全球化妆品公司,因为我们这套软件是高度自动化的,我们在整个流程上,包括监控,包括报警完全是自动化的,使自己的员工花在规划的时间大大减少,一年半的时间总共节省了75万美金。最后是来自一家美国政府部门,他们在连续24个月内,使数据中心整个电费降低了25%。

下面我会进入一个比较有趣的环节,我们会用情景演示的方式,角色扮演的方式给大家介绍我们这他软件是怎样帮助用户节能减排,降低运营成本的。在这个过程中我会扮演一家公司的IT总监,我的同事Annie会扮演这个数据中心的经理。

我们下来就开始,我们公司有很多的数据中心,我可不可以在一张图上看到所有的数据中心情况。

王小娟:可以的,我们可以看一下软件的界面,实施的界面上可以看到目前北京、上海两个数据中心的运行状况,可以看到他们是不是有设备在警报,可以看到他们的容量应用状况。这个容量应用状况包括我们比较关心的供电、制冷以及网络端口的状况。

赵明浩:我发现上海数据中心有报警,那边有什么严重的情况?

王小娟:可以的,可以切换到上海数据中心,看一下上海数据中心里边有什么情况产生。我们可以看一下这是上海数据中心物理布局图,从这个布局图上我们可以看到其中有一台空调在发生警报。我们来看一下从这个警报的状况可以看一下警报的详细信息,在这里边可以看到温度有些问题已经超过了规定的值。施耐德这个软件同时给我们提供了操作的建议,我们可以按照他们提供的建议操作做一些简单的维护,看看我们是不是自己就可以把这个问题解决掉。

赵明浩:这个软件真的不错,不光可以帮助你发现问题在哪里,还可以给你一些解决方案。

王小娟:是的。

赵明浩:说到空调,我突然想到下周空调供应商要求空调检修,到时候空调可能要停机。我就非常想知道当空调停机的时候会对我们哪些IT设备造成影响,以及在IT设备上好的业务有哪些影响?我需要通知相关的部门,相关的人员到现场支撑检修。

王小娟:可以的,我们用的数据中心管理平台可以提供模拟的操作,可以通过模拟的动作看一下如果其中的一台空调停止工作以后对我们这个业务有什么样的影响,我们可以实地看一下。这是我们的制冷空调,我们看一下可以通过影响的分析来看一下对我们哪些关键的业务会有什么样的影响。这样的话影响的结果就出来了,我们来看一下刚才我们这个空调是其中的一台制冷空调,我们看一下它会影响到我们这些设备,很重要关键的IT设备。他们的影响结果会造成IT设备进风温度上升,而且会影响到我们CRM系统和财务系统,我们可能要通知相关的业务人员告诉他们提前做一些准备,以防在维护的过程中会造成一些意外情况发生。

赵明浩:这两个系统对我们公司都是非常重要的,我们一定要通知相关的人到现场支撑我们维修的过程。

王小娟:是的。

赵明浩:我想到我在跟其他IT负责人沟通的时候,他们都在讨论绿色的概念以及数据中心PUE的情况。我很想知道上海数据中心能效的问题以及PUE的情况,你能帮我展示吗?
王小娟:可以的。我们用的这个软件是提供能效管理的仪表盘,我们现在来看一下这是我们上海数据中心能效参数的展示。可以看到PUE值以及右边会显示丙图,以这个方式显示各个子系统电能的消耗。蓝色的一块是空调电能消耗非常大,我们在做节能减排测试的时候可以按照这个结果有的放矢做一些节能减排的措施。我们这里边还提供了子系统的成本,我们可以看到我们的IT系统,我们的制冷系统,我们供配电的系统在一定时间里边供电的成本是多少,电能的成本是多少。而且我们还可以展示一下运行数据中心对我们这个环境有什么样的影响,可以显示出来碳排放是多少。

赵明浩:你把屏幕往下拉一拉,我觉得很夸张,为什么空调的电费会这么高,你这边有没有什么办法可以把空调的电费降下来吗?
王小娟:这是我们上海数据中心物理布局图,在这个布局图里边看一下当时在规划机房的时候我们看到是按照满载的情况规划制冷设备,现在所有制冷设备都是在正常工作的状态。我们可以看一下机柜的视图,很多机柜都不是很满,在这种情况下我们可以把过度规划的空调先关掉。以前我们不知道关哪台,关多少台,我们现在通过软件可以实地做一些模拟。

赵明浩:你要关我的空调,如果产生影响的话,我的老板肯定要找我麻烦了,你这是实际关的还是做一些模拟?
王小娟:做一些模拟,我们可以把空调关掉,散热问题没有任何影响。我们现在再来关一台,模拟的关掉,第二台空调关掉以后可以看一下热通道散热的问题还没有任何影响。目前IT配备情况下完全可以关掉这两台空调帮助我们节省电费。我们再来关一台,可以看到下面四台机柜已经出现了散热的问题,第三台空调是不可以关的,但是完完全全可以关掉其中的两台空调。

赵明浩:谈到空调,我突然想起来上周五去上海数据中心视察的时候,当走过有招聘服务器机柜的时候我发现很热,是不是在上海数据中心里边会有热场的问题,通过这个软件是不是很轻松的帮我找到场呢?

王小娟:可以的,我们用的软件提供了一个模拟工具,这个模拟工具和市场上用的不太一样,市场上用的运行速度往往很慢,通过几个小时甚至一天的时间才可以运行出来模拟的东西。我们来看一下这个软件气流分析工具,我们这个气流分析工具首先以3D的视图展示出来上海数据中心机房的布局。

我们可以在现场实地的看一下模拟出来的结果到底花多长时间,我现在就可以重新算一下温度热场以及气流分布状况看一下。我们来看一下是不是有热点的情况发生,我们可以在三个纬度上看一下,这个地方是以红色的情况来展示的,我们可以看到右边是一个大的温度计,以不同的颜色来标注温度不同的值,红色的显示这个地方是有热点情况发生的。您肯定希望快速的解决掉这个热点的问题了。

赵明浩:我在想上海数据中心有这个热点,我们是不是要再买更多的空调解决这个问题呢?

王小娟:买空调当然是一种比较简单的方法,可以很快地解决热点的问题,但是我们现在经费什么的,时间都来不及。我们来看一下通过软件的平台能不能帮我们节省一些资金,能把热点的问题解决掉。我们来看一下我们这个区域,这个区域是蓝色的区域,制冷效果是非常好的,但是这个区域明显是有热点问题的。我们来看一下机房的机柜视图,上面是两台机柜,这台机柜是有热点问题的。我们来看一下是不是可以把刀片的服务器,这边是有刀片服务器的,迁移到比较蓝色的区域看看情况会怎么样,我们来把它做一些迁移。
   
这个系统已经告诉我们迁移最佳的地方在什么地方。他告诉我应该迁移到比较凉快的区域,我们把它迁移过去。我现在已经移过去了,从系统里边做模拟,刀片已经移到了D排的机柜上去。我们实际再来做一下模拟的效果,看看热点的问题,是不是经过这种情况就可以得到解决,在不配备更多空调的情况下我们来解决机房的热点问题。

现在新的结果就出来了,我们可以三个方向来看一下热场的分布,我们还是看看刚才Y轴的方向。这个地方就有红色的热点问题存在,通过服务器的迁移,系统告诉我服务器应该迁移到什么地方,可以解决热点的问题。

赵明浩:我越来越喜欢这个软件了,可以在不增加硬件成本的时候还可以解决现有的问题。下周我们会在上海数据中心新上架五台服务器,通常情况下我们可能会派比较有经验的一到两个人到现场勘察情况然后再花差不多半个月的时间找出最合适的问题。通过这个软件是不是可以帮助我很快速的找出我上架的位置?

王小娟:可以的,这个软件其中的功能就是顾问功能,可以看一下新上架五台服务器摆在什么地方,我们不需要专业的人员,只需要专业的软件就好了。这边需要选择服务器的型号,您这边希望放置的台数是5台,直接添加过去,看看系统帮我找到设备最佳位置。我们以前放置新服务器考虑的问题特别多,三项是不是平衡。我们这个系统可以综合考虑这些因素,帮助我们非常快的看一下设备最佳的位置放在什么地方。
 
他已经告诉我们五台服务器应该放在机柜里边,显示出来相应的预留空间,这个预留空间就可以帮助我们避免搁浅的产生,延长数据中心的寿命。不仅仅帮助我们规划出来设备的最佳位置,这个任务单已经产生出来了,可以派发给现场的工作人员,由现场的工作人员按照任务单严格执行IT设备的变更,可以避免IT的人工失误,这方面可以给用户一些帮助,避免一些计划外宕机的情况发生。

赵明浩:这个太棒了。王小娟你知道在我们数据中心里边采用了大量虚拟化的技术,我很想知道我们现在在使用的软件,虚拟化方面能带来哪些附加的价值?

王小娟:大家可以把屏幕切换到左边的PPT上面来,可以看一下我们这个示意图,有两台UPS,给我们右边的两台机柜进行供电。我们这两台机柜,每个机柜里边都分别装了物理机,绿色长方形代表虚拟机,可以看一下有六台虚拟机运行。我们这两台UPS被我们的中央管理器监控的。由于某种原因UPSA就转到了供电,这个警报就被捕捉到了,就把这个警报上传到运维管理平台上。运维管理软件进行影响分析,根据位置和供电线路进行影响分析,影响分析的结果会上传到我们虚拟机的管理平台上去。虚拟机管理平台根据影响分析会做迁移,受到威胁的两台服务器上跑的虚拟任务就自动迁移到2上面,不受影响的两台服务器上面去了。

我们以前做虚拟机迁移的时候往往只是考虑CPU内存的状况,我们现在不仅考虑到IT的需求,还可以考虑到基础设施。可以说施耐德这个软件是历史上第一次实现了IT层次和物理基础设施之间的联络,真正的团队合作。

赵明浩:真的太不可思议了。你知道我经常会跟IDC的负责人沟通,他们也采用了大量虚拟化的技术,但是他经常会告诉我虚拟化技术是可以自动漂移虚拟任务的,但是通常情况下他们都不敢这样去做。因为我们知道虚拟化可能更关注的是CPU够不够,存储够不够,内存够不够,但是他从来不考虑飘过去的机会里边供电制冷的问题。如果是自动飘过去的话,有可能对我目的的机柜会造成影响,对其他的业务会造成影响。我们现在如果能做联动的话,真正能做虚拟化的自动漂移,实在太好了。

王小娟我还想了解数据中心容量的情况,比如说供电、制冷,包括网络接口的情况?

王小娟:我这边屏幕已经展示出来上海和北京两个机房容量应用状况,我们上面是以丙图的方式来显示我们的供配电和网络端口的应用状况。可以看一下它们的容量是怎么样变化的。

赵明浩:是不是意味着我需要买更多的制冷设备?

王小娟:是的,需要提前规划一下数据中心的设备。

赵明浩:我需要你来帮我设计这个表格,当然这个表格也要符合我们公司展示的形式,你能做到吗?

王小娟:可以的,我们用了这个软件,定制了一个自动化报表的数据。这个工具可以帮助我们快速的制作出来我们自己想要的报表,现场可以帮我们做一张报表,应该马上就可以了。我现在随便做一张报表看一下,这边有很多的模板,在这个基础之上可以快速的修改一下,就可以变成我们自己所需要的一张报表。我这边也有资产报告,我们来看一下这个模板的基础上修改一下,做出来我们想要的报表。

您现在需要一个资产报告,在这些地方可以把不要的这些东西去掉。因为你需要在董事会上应用,所以这个报表一定要符合我们公司的同事,我们实际运行一下,看一下运行出来的结果会怎么样您需要一个IT功能的,其实他可以做出来不光文字上的报告,还可以做出来很多无形的报告,格式可以定义。我这边已经运行了这张报告,可以显示出来IT部门所有资产状况都在这了。

赵明浩:真的很方便,到目前为止你给我介绍很多,我对这个产品功能了解很多,我感觉这个软件对我们这个业务是很重要的应用。我还想知道能不能支持高可用性?

王小娟:我们这个软件可以装在多台的服务器上去,装上故障转移和负载均衡来满足用户的高需求。

赵明浩:我觉得这个StruxureWare太棒了。你知道我不可能随时都带着我的电脑,软件是不是可以支持现在Ipad和iphone这种东西?

王小娟:这个软件可以支持这些移动设备,我们可以通过无线的方式。他们可以随时随地掌控数据中心观念性能指标,比如说界面上就可以展示一下数据中心容量的应用状况以及容量变化状况。可以看到容量在目前的变化趋势下,这个数据中心还能支撑多长时间。就是说多长时间以后必须规划我们这个数据中心,需要扩建或者新建给到我们一些好的建议。

这个软件还可以提供资产的状况,也就是说数据中心管理人员可以随时随地看一下数据中心的资产,资产的名称和描述,装在什么位置随时随地给我们的数据中心管理层一个比较高水平数据中心的指标,随时随地掌控一下数据中心的运行状况。

赵明浩:我们演示部分到这里结束,我们大家可以通过实际的操作看出来,我们有完整的解决方案,施耐德不仅仅称自己是能效管理专家,我们有十几的案例,实际的方法,有十几的产品来真正帮助我们的最终用户解决他们在能耗方面的问题。谢谢大家,我们讲演到此结束。

链接已复制,快去分享吧

企业网版权所有©2010-2025 京ICP备09108050号-6京公网安备 11010502049343号