“高效制胜、扩展无限—Dell HPC 行业应用实践交流会”于2012年6月20日在北京悠唐皇冠假日酒店盛大召开,戴尔技术专家及行业技术精英和与会者切磋交流,共商HPC发展之大计。
以下是现场快递。(声明:本稿件来源为现场速记,可能有笔误和别字,仅供参考)
主持人:非常感谢陈工的精彩演讲,接下来有请Dell(中国)大客户及公共事业部高级市场经理李毅为我们分享高性能计算中Dell服务器解决方案,有请。
Dell(中国)大客户及公共事业部高级市场经理李毅
李毅:大家好,今天非常高兴有这个机会跟大家一起交流Dell12代服务器,怎么样帮助推动高性能运算集群事业的发展。
我们首先看一下整个业界的趋势,Dell看到整个业界有三大趋势所组成,一个是整个IT业界,现在移动互联越来越多,需要随时随地去访问数据,而且数据才能越来越多,大家现在手上都有智能手机,智能平板电脑等等,移动数据随时地要接入到我们数据中心进行处理,对于处理大数据提出了新的挑战。另外是虚拟化,主要从整个提高IT架构的利用率角度来提的,同时我们高性能运算也是一个重点,因为虚拟化主要是从利用率这个角度,而我们高性能计算对每个单个服务器的CPU、内存利用率相当高,所以我们的任务是怎么样进一步突破这个瓶颈,等会我会跟大家分享我们第12代服务器是怎么样在这些方面帮助运算集群客户,实现他们的目标。
还有一点就是云计算,云计算这两年也是比较热点的话题,其实云计算很早以前,由高性能计算这边提起的,后来又高性能计算的网格,有这么三种云,一种叫做公共云,公共云一般是大型的互联网商,比如新浪等等,还有一些是属于企业的私有云,私有云是建立我们在现有的IT基础架构之上,然后进行扩展,把现有资源做一个资源池进行有效管理。还有混合云,把你的一些数据,一方面存在你现有的企业私有云下,然后可以把其他的一些数据,特别是保密要求不是很高的数据存在公共云。
然后对于客户来讲,存在着三大主要的问题,第一个是缺少容量,主要是指的缺少进一步发展的能力,比如说咱们在CPU,在内存的带宽,在这方面现在都是制约着的高性能计算进一步的发展。另外就是复杂的技术,现在各个厂商都有服务器,然后有各种各样的存在,还有各种各样的网络架构,整个就是要管理这么一个复杂架构现在是非常大的挑战。我们曾经做过一个7700多个客户,17个国家,横跨四大洲的调查,发现IT的复杂性来说,都是我们IT管理人员最关心的问题,怎么样解决这个复杂性的问题。还有一个就是我们数据的安全,怎么样能够迅速的访问我们的数据,同时又能保证我们的数据安全,也是大家关心的话题。
Dell的第12代服务器,正是基于这三点推出来的,我们目标在于通过我们的硬件架构以及管理方式,能够进一步提高我们的生产率,待会我会介绍我们从CPU到GPU到内部存储到I/O方面我们有哪些进步,另外怎样将工作负载管理自动化,高性能计算来讲的话,可能要管理成百台上千的服务器,这样的话怎么样提高IT管理人员的管理效率,怎么样把日常非常乏味的管理工作,比如像一些驱动程序的更新,让机器来做,这个就是我们12代服务器能够帮助大家做到的一点。
另外就是最大程度的提高效率,效率有两个方面,一个效率是指咱们在相同的时间完成的工作更多,还有一个效率是在相同的成本完成的工作更多。这方面会有几个方式实现,一个是提高IT管理效率,还有就是提高咱们整个数据中心,特别是对咱们高性能计算运算集群来讲非常重要,提高整个数据中心的能耗管理水平。
Dell我们是从92年开始做服务器的,到现在为止我们在服务器在全球已经是排名非常靠前了,如果是X86服务器的话现在排名第二,而且在中国我们去年排名第一。整个服务器这块非常强,而且现在我们的存储,我们的网络解决方案也非常强。
另外就是网络解决方案,Dell我们是以Powerconned为主,现在我们在刀片上已经可以提供40万兆的MSL,在这块对于追求高速以太网互连的客户是非常吸引的。还有我们的服务以及我们的合作伙伴,Intel是我们非常重要的合作伙伴。还有Dell的服务,以及使用和管理,这块都有很成熟的表现。
我们谈到HPC,高性能计算集群,HPC是作为整个一个工作负载的部分,我们把整个工作负载分成这么五大块,一块就是一般来说的企业业务处理,主要做一些ERP这些性能,还有一块是决策支持,主要是后端数据库的处理,还有一块是我们HPC最关心的,就是行业的研发,这块包括像工程、技术。还有就是给整个企业提供IT和网络的基础架构,还有一块日常的发邮件,分享文件的合作。
首先我们谈一下HPC的应用,在座的都是各行各业的专家,刚才张云泉老师也介绍了整个HPC应用情况,特别是在国内有哪些行业,有哪些企业使用HPC。我也讲一下Dell是怎么看待的。一个是制造业,制造业主要是像有些汽车、飞机、航空航天,在做设计的时候,大家如果注意到,我们在外面有一个演示,那个演示就是汽车碰撞的HPC简单演示的视频,大家可以看一看。另外还有就是能源和地质科学,石油石化,通过爆炸,研究地震的数据发现一些矿藏。还有生命科学,早上我们放的视频有介绍。还有就是高能物理,主要在大学里面,像Dell就帮中国科大安装了HPC整个一套东西。还有现在比较新兴的,就是在金融行业,金融行业分析股票,分析期货,然后他现在不是简单的就是看那个趋势度,而是他分析众多的因素,模拟运算,推断期货和股票价值,这个在国内还是属于刚刚新兴的行业,但是在华尔街已经是非常流行的了。
我们再谈一下,整个HPC对服务器有什么新的要求。大家可以看到,一个是CPU,CPU现在要求支持核数越来越多,处理器主频和TDP大致不变,每核性能不断提高。内存的瓶颈存在着内存带宽,内存通道,还有整个内存支持的插座,这些都在不断的提高。但是内存的提高速度,目前还是落后于CPU提高的速度,这块也是对我们整个服务器的设计提出了新的挑战,怎么去进一步提高你的内存扩展能力。现在越来越多是使用一种叫做重核的技术,这是一个新的技术,待会我也会介绍我们12代服务器在也方面有哪些新的进步可以跟大家分享的。现在CPU越来越快,内存带宽越来越宽,但是你还需要PCIE速度也要进一步的提高,现在在新一代服务器都从第2代的PCIE转到第3代的PCIE。然后我还有网络链接,现在的速度也是越来越快,InfiniBandQDR及以上的技术,Ethemef万兆及以上。怎么提高它的制冷和散热,还有数据的存储以及提取这块都是新的挑战。
所以我们整个12代服务器,它的一个宗旨,就是进一步把我们计算能力转化成您的生产力,进一步提高,作为学校也好,作为工业企业也好,提高您在市场上的竞争力,学校有什么竞争力呢,学校当然有了,如果有更大的高性能集群计算规模的话,在整个教育部的排行里面排得更先,得到国家的支持更多,同样在美国也是这样的,所以这个也是非常重要的。整个来说的话,我们12代服务器,我们的核比11代多了30%的核,而且每秒执行的浮点运算提高了两倍。
Dell是全面的解决方案,所以我们有一个强有力的联盟。还有一个全面的服务,还有一个我们针对250个结点以下整合的解决方案,还有一个是智能化的基础伏安的实施,这些都是Dell针对整个高性能计算的解决方案。
大家可以看一下,这张图分成三个集团,首先是计算集团,CPU这块,业界主要的这些CPU厂商,以及GPU的厂商都有密切的合作,有Intel,有AMD都有合作,在操作系统跟微软这边也都有一些合作。存储,从网络文件存储到高性能存储,还有归档解决方案都有合作。所以是一个非常全面的解决方案。
这也得益于咱们客户对Dell的支持,在这里我再次感谢咱们在座的客户对戴尔服务器的支持,特别是高性能计算Dell成长非常快,从去年开始加速的成长。大家可以看出来,在去年四个季度,根据IDC的报告,Dell连续三个季度是市场占有率第一,我们从第二季度开始,二、三、四季度都是市场占有率第一。所以我们通过服务大量的客户,从而积累了丰富的经验,这些就是整个戴尔服务器简单的介绍。
接下来我会再谈谈12代服务器有哪些亮点,一个亮点就是功能强大,另外一个是业务持续,还有一个是效率提高,跟咱们前面客户追求那三个亮点是相吻合的。功能强大这块,一个是在CPU和GPU的运算上面,还有在I/O这方面,还有现在我们在服务器里面提供了内置的服务硬盘,能够满足客户对追求得到更快的效果的这么一个目标。还有是一效率的提高,一个是从管理方面下功夫,我们推出了远程管理卡,有两大特点,一个特点是免代理程序服务器管理,随时随地开展管理,可以在你开机以后,操作启动之前自动发现更新部件,帮助你去更新,这个东西我们是在业界首先推出的,还有就是更好的电力监控控制,能耗成本是非常重要的因素,我们现在跟Intel这边的结点管理器合作我们有一个OPEN电源管理中心,不但可以管理服务器层级,还可以管理机架层级的,甚至整个数据中心的电源管理都可以实现,在网络这块也有非常多的进步。
我们再谈一下CPU这块有什么进步,Intel也跟大家分享了,在同样功耗级别上,跟前一代比较,整个性能提高了80%,特别是高性能计算,在这块提高得更快。还有一些Intel的技术,刚才陈江已经介绍得非常详细,我就不一一再讲了。从CPU这块是的确有非常大的提高。
另外,我们现在把GPU整合在我们的机架式服务器里面,在我们的几款产品里面提供了内置式的GPU,现在可以真正实现GPU和CPU的混合运算。现在目前我所知道惠普有相类似的技术,但是惠普提供GPU的功率是不如Dell的,因为Dell提供的更强,Dell是300W,惠普是150W左右,Dell非常看重客户的需求,对一些并行运算,整个GPU加CPU混合运算速度可以增加8倍左右,对追求更快速度的企业是非常有吸引力的。
还有就是高性能计算是非常吃内存的运算,我们更看重内存的频率和扩展率,频率已经可以达到160兆,扩展率这块,整个12代服务器,我们主流服务器现在已经可以扩展到24个内存插槽,最多可以768GB的内存,扩展能力非常强。在刀片式服务器,由于它的空间非常小,大家如果有空可以到外面看一看,我们有刀片式服务器的展示。我们的M620可以扩展到24个内存插槽,这是非常难做到的,现在目前友商最多扩展到18个或者16个,这块内存扩展能力是非常强的。
还有固态硬盘,PCIE的固态硬盘,对于追求高数据的转换率,高的吞吐量这些客户比较有吸引力,以前传统的PCIE的卡是插在后面的,现在我们已经做到可以把它放在前面,就是跟普通的2.5寸一样,但是他有一根线连到后面的PCIE,直接跟CPU是相通的。16块传统的硬盘还不如现在一块PCIE硬盘的十分之一,整个速度提高非常快。
还有一个就是免代理的监控,不管用不同的操作系统,甚至在操作系统没有启动之前,都可以进行监控和管理。还可以进行自动更新,像主板的更换,像网卡,网络识别器,这些如果更新可以自动发现帮你更新这些物件和驱动程序。
我们提到从服务器到机架,到行列,和整个机房进行电源的控制。说到节能我再提一个,现在我们12代服务器,全部主流服务器已经是白金级的电源转化效率,甚至我们现在已经有推出钛金级的了,从能耗这块也是大大的提高了电源的利用率。
还有更多的网络选择,现在我们在主流的12代服务器,比如R7.0上面,我们提供了精选网络适配器的产品,取代了传统的网卡,客户有更多的选择,不同的网速可以选择千兆可以选择万兆的网速,可以宣传不同的协议,给客户更多的自由选择的权利。
分区存储,大家有没有听过Cachecode这个技术,把热点数据到固态硬盘里面,一般的数据存到普通的硬盘里面,这样的话,实现你的速度和成本有效平衡,这样一方面提高你的速度,一方面节省你的添置硬盘的成本。
还有就是保持动态数据,我们整个缓存已经可以达到1G,而且性能比前一代提高两倍。
管理从四个层面,从部署一直到变更更新,一直到监控,一直到维护正常运行,整个都有提高,特别是在这块,不依赖代理监控这块,这块我们可以实现不依赖操作系统的监控,不会浪费CPU的周期,还有一点就是变更,可以自动发现你的这些组件进行变更,还有是部署这块。
整个产品线,红色这部分是我们更新的12代服务器主要的产品,我们最大的是在机架式服务器这块,在刀片式服务器,我们整个从4/1高的刀片,一直到半高的刀片,一直到全高的刀片全部都有,而且刀片这边我们实现了新的冷却技术,在90%的湿度,45度的环境下,每年还可以运行90个小时左右,在40度环境可以运行到900个小时,所以有断电可以延长数据中心在没有空调环境下工作的时间。
M620有一个最大的特点,它的内存扩展是大大的加强了,现在咱们M620可以支持24个内存,最多支持768GB的内存,他支持PCIE的硬盘。
我们在5月底的时候,我们又推出了新一拨的刀片服务器,M420,这是业界首先推出的4/1高的刀片服务器,核数可以达到512个,是非常强大的计算能力,大家追求密度的话可以考虑这个,如果要是追求价格和性能的平衡可以考虑我们M520,内存扩展可以到12个内存槽位。
整个覆盖HPC的工作负载,从头结点到计算节点我们产品线非常全了,如果追求更高内存带宽,可以选择Intel的R820,还有一款是刀片服务器,M820,再加上C6145,还有GPU的计算,有410。
整个来说,从HPC的客户所追求的几个点,像可用性,高性能,高网络性能,高可用性,还有整体用户成本这块,更加节能。
同样我们也得到了非常多的客户赞誉,这边列的是国外客户,比如像美国的犹他大学,R620怎么样帮助里昂高等师范学院,提高它的高性能计算技术。还有很多媒体也是提出了赞扬。
国内也是一样,新浪、清华大学、首都在线,都对新一代12代服务器有所赞誉。
总共来讲,我们12代服务器帮助大家更好的提高工作效率,有效的减少成本,同时提供更强大的计算平台,帮助大家完成更复杂的工作负载。凭借虚拟化提高利用率,这三点是我们12代服务器的特点。
非常感谢大家!