高性能计算的发展趋势及Dell解决方案

责任编辑：sjia |来源：企业网D1Net 2012-06-20 10:47:22 原创文章企业网D1Net

“高效制胜、扩展无限—Dell HPC 行业应用实践交流会”于2012年6月20日在北京悠唐皇冠假日酒店盛大召开，戴尔技术专家及行业技术精英和与会者切磋交流，共商HPC发展之大计。

以下是现场快递。（声明：本稿件来源为现场速记，可能有笔误和别字，仅供参考）

主持人：非常感谢张博士的精彩演讲，张博士从中国TOP100排行榜谈起，从各个领域都做了简要的分析，但是相信在座各位非常关注，更关心的是我们中国的用户更加个性化的需求，尤其是对高性能计算需求非常大的这些行业，包括政府、教育、医疗。我们如何在我们个性化的需求情况下，如何找到适合自己的解决方案，如何落地，相信是各位最关心的。接下来就有请Dell高性能计算产品技术顾问凌巍才给我们带来高性能计算的发展趋势及Dell解决方案。

Dell高性能计算产品技术顾问凌巍才

凌巍才：尊敬的各位来宾大家上午好，非常感谢大家来参加Dell高性能计算技术研讨会，刚才李总和张博士非常精彩的介绍了Dell公司HPC的发展策略，张总也介绍了发展的趋势，在我的片子里我会主要介绍一下Dell公司的解决方案。

首先自我介绍一下，我是凌巍才，我是负责高性能计算的工程师。我讲的内容主要分四个部分，第一部分是高性能计算的发展趋势，主要是针对Dell来讲的，第二就是HPC的策略和我们怎么样进入这个市场，进入市场的方法。第三部分主要介绍一下，进入这个方法其中我们详细的一些解决方案，最后介绍一下我们的成功案例。

我们在谈HPC的时候通常都要谈它的发展趋势，每个企业，每个组织，或者每个单位，如果他想进入这个行业他都会谈这个趋势，而且每个单位谈的角度也不同。那么Dell公司怎么来看这个高性能计算的发展趋势，这就是我们在做高性能计算的时候我们看到的趋势。首先我们说他的CPU，高性能计算主要是用CPU来做计算，CPU发展是非常快的，通过过去几年的发展，我们看到随着一些IT巨头的合并，这种快速的发展，X86这种平台会在HPC市场越来越多的参与进来。还涌现了一些新的处理器的技术，但是不知道会参与到这个HPC市场，用来做网络和移动终端的处理器，我们看的话，就是看CPU的趋势。

内存也是非常重要的，我们在做HPC的话，内存的带宽和内存的延时，都是某些特定应用所主要考量的指标。我们在内存的带宽上面，我们也在监控，现在新的基于X86我们每个CPU所连的内存带宽已经有四个通道，主频已经到了1.6G赫兹，延迟更小，做计算的时候会更快的向CPU提供数据。还有就是加速器，GPU，GPU发展的也非常快，很多大型的HPC都在采用GPU的计算，GPU是特别擅长，它做一些浮点运算的拿过来，他叫多数据的算法，他这个是脱离传统的CPU的编程和计算方法。

PCIE的带宽也很多，3.0可以到达128每秒。数据也是海量的增长，这个数据的增长，数据增长会比摩尔定律还要高很多倍，还有软件，包括管理软件，包括云，都是基于软件的发展，也是非常的快，非常的多，软件也非常全。那么供电和散热也会在下面的图介绍一下。新的处理器，在高性能计算测试和在HPL这方面测试耗电的比较，这张图1，我们是用Dell公司第11代服务器做出来的高性能计算HPL的性能测试结果，620测试出来的结果，平均要高出来2.5倍，所以说用新一代的Dell620的话，新的服务器采用新的处理器技术性能高了很多。大家可以看一下，这边的功耗，在相同功率的贡献情况下，新的620，性能也比以前提升了两倍以上。

双处理器集群平均内存，现在处理器核数不断增加，他对于每个结点的内存也是在不断的增加的，平均来说，对单个核来讲，内存基本上是保持不变的。

下面这张图是我们采用加速器的比例，这张图的话，我们是从这个月做的研究调查图，在采用GPU用户中大概现在的比例是29%，这个比例会低于TOP500里面的大型数据，大型集群的话，他会采用较多的GPU的加速运算技术。再看一下，我们PCIE的话，如果是第3代和第2代，而且采用的是不同的技术第一个是数据传输率的带宽，一个是延迟，大家可以看到采用FDR，他的性能会增加169%。如果采用新的FDR的技术，并且采用PCIE第3代，性能会有非常大的提升。那么在延迟的话，也是FDR延迟0.77微秒。

我们的策略，我们是采用开放的平台，一个标准的架构，以及很高的性价比，这是我们的策略，所以说我们在进入高性能计算这个是市场，我们坚持的策略是用开放的，像X86处理器，以及市场上可以采购得到的高性能内存，都是非常标准的，非常开放的，而且是高性价比的产品。

下面介绍一下Dell公司的HPC，我们的策略有了，那么我们怎么样进入这个市场，我们进入这个市场的方法有三种，第一种就是和我们的用户来进行合作，如果我们用户在这个领域里面，他知道他要做什么，那么我们就会跟用户进行合作。第二部分我们就是要和我们的搭档合作，他在研究领域有一定的专利技术或者技能专长。第三部分我们提供一个简单的硬件平台给用户。

用户协作和合作伙伴，我们是怎么和用户进行协作，比如德克萨斯的高级计算机中心，这个用户他知道他要做什么，他有多大的需求，我们就会和他来合作，来做这样的系统。另外我们还有一个和剑桥大学，剑桥大学和Dell公司合作成立了高性能计算中心，我们可以在这个中心上面来为剑桥大学提供他们自己的计算需求，同时还可以向市场提供包括测评、新产品技术采纳，以及程序的修改调优等等服务。

另外我们怎么和合作伙伴进行合作呢，我们要和包括结构力学，流体动力学，基因比对，以及数字内容的生成等等，我们和这些软件厂商合作走向市场。我现在主要介绍，除此之外我们第三种办法，我们用非常简单的硬件设备，标准的开放的，向广大的市场提供解决方案。

Dell的HPC方案结构，也是非常的简单，它是模块化的，除非特别大的应用，很多的应用，它的线性增长率是有一定限制的，他可能在一千个核之内，他并行的效率提升会非常显著，但是超过一千核以后，效率就不显著了，在这种情况下我们就把这种不同的应用放在不同的，我们叫单元格上，然后包括应用与应用之间的通讯，我们也根据应用需求来判定采用什么样的互联网络技术，以及存储，我们都会根据用户需求来定。存储单元架构，不同的HPC的方案，有可能存储单元架构是不一样的，通常我们在这个领域里面我们把它分成三个层级。

下面介绍一下Dell公司其中两个部分，一个是计算部分，一个是软件部分。这张图大家可以看得到，上面是所有Dell服务器系列，这边是机架式服务器，机架式服务器面积最大，这边应用的类型，包括单排的应用，包括高可用性集群，包括虚拟服务器池，高性能计算，包括云，纵轴是不同的应用。然后这边是我们的出货量，或者是我们的市场占有率，机架式服务器是最多的，然后这边是刀片服务器，这边是云系列服务器，然后这边是我们为客户定制的服务器。

下面向大家介绍一下Dell公司的刀片服务器，这是刀片一千亿的机箱，这个机箱底下有两个KBM接口，这边有一个显示控制器，这里面可以放服务器，我们这里面的服务器有各种型号供选择，后面我们可以由6个IO插槽，可以插不同的插槽，包括以太网，包括存储的光纤通道，后面还有一些电源和风扇，可以通过远程来进行管理。

这张图片，所有刀片服务器的不同型号，我们这里面可以看到有M620，M610，M710，所有这些都是半高的，里面可以插16台服务器，这都是双路的。下面都是全高的，劝告有M610，还有M710，这边是全高的四路的，有AMD，还有Intel处理器的。我们还有新出的一种刀片服务器，我们可以装32个刀片，在10U高的纪香里面。细节我就不讲了。

下面我介绍一下我们云系列的服务器，我们这边有单排的，还有共享架构的，包括他共享的是电源和风扇以及网络、连接，还有管理、控制这都是共享的。我们云系列的服务器，它共享的是电源和风扇，其他的包括网络、控制、管理都是单独管理的。所以说这个就是共享了。然后这边的话，我们还有很密集的云系列的服务器，那么后面的话，我们会介绍一下C系列，其中我们云系列的C6100我们共享基础架构的服务器，他可以放4台服务器，每个系统里面可以有两个Intel处理器，他这里面可以插12个内存，前面可以放24块2.5寸的硬盘，或者12块3.5寸的硬盘。这是第2代PCIE接口，他的管理口，有热插拔电源和风扇。

下面我介绍一下我们第12代云系列服务器，PCIE是第3代的，这是他整个更新的地方，2U的服务器里面可以放两个也可以放四个，这个是采用Intel的ABS技术，等于是高级的制定技术，他可以运行八个浮点运算。C6145他可以到达128个核，我在以前的时候，曾经做过一个中科院数学所的，四个大机柜，一共才64个CPU，这一个系统就已经是4个机柜的两倍了，可以看得到，现在HPC技术发展非常快。

这个系列是我们专门用来做云计算，他是高密度的服务器，存储包括计算都在一起，4U可以接十台系统，他的系统也是非常的好。我们还有一个客户定制的系统，我们刚才说了有很多处理器的技术，我们现在也在紧跟着这个，我们用ARM Servers，他这个里面也是采用领先的技术，等于是我们非常勇于创新的企业，我们也在尝试用新的CPU用新的服务器系统，我们针对的用户是互联网用户，或者是我们的TACC。

刚才简要介绍了一下服务器，下面介绍一下管理软件，监控软件我们用idrac7，这是我做了一个截图，除了对服务器进行控制以外，还可以对电源有一个设定，可以极大的降低功耗。

软件上面我们有一个软件站，我们有操作系统，集群管理软件，调度软件以及各种各样的应用，我们在这个软件部分，我们可以和很多的厂商来合作，我们是一个非常开放，非常标准的平台，很多基于X86技术的这些软件，我们都可以用。

下面介绍一下GPU，我们有很全的产品系列，我们可以外部接也可以在内部接，不同的连接方法有不同的连接比例。我主要介绍一下外部连接非常有特色的产品，C410x，PCIE的GPU扩展箱，他是一个纯的PCIE的扩展箱，它是把GPU从服务器里面拿出来，单独的放在一个扩展箱里面，这样的话，特别适合于那种就是说，他对这个应用的测试比较灵活，如果你现在一个服务器可以接一个GPU，那么也可以接两个GPU，也可以接不同的GPU来进行配置。这只是其中的一个案例，我们在用C410x和6100来连接的时候我们做了4/1的三明治，我们有三种配置，这只是其中一个。第一种配置是两个C6100中间加一个C410x，这是第一种配置，真正的全三明治。他这里面可以放16块GPU，C6100里面可以放4个系统，16块GPU，每4个GPU连接到其中一个结点上面来。

下面介绍一下这种连接方式，对于应用有什么样的提升吗？再一个多GPU应用的分析，HAMER，黄颜色是一台主机对一个GPU，绿颜色是一台主机对两个GPU，灰颜色是一台主机对四个GPU，它的线性增长率非常好，接4个GPU的时候，性能可以增加了7.2倍。

介绍完了计算和软件的部分，下面介绍一下存储部分，我在这里简要介绍一下我们HPC存储，他是一个架构和方案，我们把HPC存储分成三部分，包括快速存储，用户存储和归档存储。

我们在针对不同的用户级别的话，我们采用不同的存储解决方案，在小部门的集群下面，我们用NSS系统，我们在做大系统的时候，我们用我们快速的系统。

我们是怎么来做存储的，我们存储也是遵循了Dell公司的策略，采用开放的，标准的架构，我们这种架构就是用标准的服务器和开放的存储，把它连接起来，我们可以配置不同的软件，实现不同的功能。

这个是我们和我们的合作伙伴配置的事例，我们经过严格测试从小到大，不同的规模我们有不同的配置方案。我们Lustre文件系统，它的性能委员好。

我们还可以采用PVFS架构，它可以纵向扩展和横向扩展，他在纵向扩展时候就可以在我们存储模块上面，用一台服务器下挂存储，然后配置文件系统，如果横向扩展的话，我们就可以把多个模块连接在一起，这个文件系统是把MDS数据平分到很多不同的结点上面来了，而Lustre是集中的，在大型的HPC上面用得非常多，在前三十个HPC里面他有13个。15个都是用的Lustre。

我们都知道，做HPC存储的时候，主要是计算结点和存储结点之间的带宽，我们这个里面采用特殊的配置，一共配置了五块盘，不同盘有不同的功能，磁盘托架之间做条带化处理了。

刚才介绍的是存储部分，下面介绍一下互连部分，我们在做HPC，现在有的网络技术和性能，有千兆网，有万兆网，还有DDR和QDR，很多不同应用会用不同的网络连接系统，通常在地震数据处理，还有生命科学的一些应用领域都用以太网，在其他的科学研究，一些特定的CAE和CFD用互联网技术。

Dell有非常全的网络产品，我们在做HPC计算的时候，我们都是千兆介入，我们可以用无阻塞的产品，在做管理的时候，刀片可以配M6220。

我们做了很多成功案例，国内包括清华大学生命科学研究院，这边是我们国内的一些案例。下面是国外的案例。由于时间关系，我的演讲就到这里，谢谢大家！

关键字：服务器高性能计算