当前位置:服务器企业动态 → 正文

实物来作证 ARM真能做服务器么?

责任编辑:editor006 |来源:企业网D1Net  2013-03-20 15:08:11 本文摘自:驱动之家

称霸移动领域后,ARM试图进军并占领桌面、服务器早已经不是秘密,也有很多厂商行动起来,但从目前的迹象看,ARM服务器即便爆发最快也得等到2014年。虽然ARM架构在这几年各方面都堪称突飞猛进,但究竟能不能从Intel Xeon、AMD Opteron那里夺得一杯羹,还有待观察。

在目前已有的一些ARM服务器产品中,基本都是概念试验性质的,完全没有大规模铺开,因此想一探究竟也非常困难。又是大佬AnandTech,他们从英国Boston那里拿到了一台迄今为止堪称最为成熟的ARM服务器“Viridis”,其中使用了Calxeda专门为服务器开发的ARM SoC,并且和Intel Xeon、Atom进行了实际对比测试。

ARM服务器是骡子是马?终于第一次有了真正的评测数据。

来瞧瞧ARM服务器

这台服务器首先在外观上就很有特色,前面板赫然是红色的,在强调沉稳的服务器领域可不多见。Calxeda在这里用不同颜色来代表不同用途,红色对应云平台,橙色代表NAS应用,蓝色则是高性能集群。

注:原文中一些关于服务器零部件的介绍我们就特意略过了,重点只看处理器相关的。

前面板之后是24个2.5寸硬盘位,可以安装SATA硬盘,还有一个标准的750W 80PLUS金牌电源。

主板和普通x86服务器上的很不一样,没有任何CPU、内存插槽,而是遍布PCI-E插槽,每对插槽插上一个EnergyCard(简称EC)扩展卡,就构成了一个服务器集群。

每块EC上有4颗处理器、4条mimiDIMM内存插槽、16个SATA接口,相当于4个服务器节点。

每台服务器可以安装12块EC,那就是48个节点,不过光纤互连架构最多可以支持到4096个节点,具体多少就看怎么配置、需求几何了。

评测样机只有6块EC、24个节点。内存安装的是Netlist 4GB 1.35V ECC(PC3L-10600W-9-10-ZZ),总计24条、96GB。硬盘使用了三星MZ7PC256HAFU 256GB(类似消费级的310系列),每颗处理器对应一块,总计24块、6TB。以前的版本还有microSD卡插槽,现在取消了。

风冷散热方面做得倒是很巧妙,不过拆装起来有点费劲。

处理器名字叫做EnergyCore ECX-1000,台积电40nm工艺制造,Cortex-A9架构,四核心,主频1.1-1.4GHz,典型功耗3.8-5W。

每个核心有32KB一级指令、32KB一级数据缓存,所有核心共享4MB ECC二级缓存。普通移动处理器里一般只有1MB二级缓存,还不支持ECC。

处理器内还有优化SIMD处理的NEON扩展、独立的FPU浮点单元、TrustZone安全模块。Cortex-A9可以每时钟周期解码两条指令,并分发最多四条。这和双核心双线程的Atom差不多,但是跟Sandy Bridge Xeon E5的4-5条解码、6发射是没法比的。

真正的大杀器是功耗:Calxeda宣称,整个服务器节点在1.1GHz频率时的负载功耗最低只有5W,待机时更是区区0.5W。

服务器更离不开软件支持和优化。Calxeda在操作系统上支持Ubuntu、Fedora,不过理论上任何基于32-bit ARM Linux内核的编译版本都能够运行。Ubuntu ARM已经有了一个预编译的Highbank镜像可用。

Calxeda也在这方面投入了一些开发资源,并加入了非营利组织Linaro,旨在为ARM SoC打造开源生态系统。

截止去年底,Calxeda生态系统涵盖的操作系统、编译器、编程语言、调试器、Java、应用程序如下:

【实际应用测试】

不过上边都是理论测试,也没有发挥ARM服务器多节点、高性能光纤互连的特性。该看看真正的应用了。

Calxeda宣称,ARM服务器并非面向一般IT管理,而是适合以下四种环境:Web应用、中间层应用、离线分析、存储和文件服务。

为此假设两套服务器。Xeon方面除了两颗E5-2650L,还加入两颗E5-2660 2.2GHz/95W,同样八核心十六线程,这就总计四颗、32核心、64线程。搭配128GB内存、ESXi 5.1虚拟环境创建24个虚拟机,每个里边都假设一个PHPBB(Apache2/MySQL)网站,各自分配4个逻辑CPU核心、4GB内存,占用硬盘空间约8GB。再模拟75个并发用户,每0.6-2.4秒发送一个新的请求。监控使用vApus压力测试框架。

这相当于每秒钟有几千个用户点击十几个网站,一天下来就会有上亿次点击。实际测量网络流量峰值8Gb/s,高于典型的4-6Gb/s。

ARM方面负载相同,但用的不是虚拟机,而是24个物理节点。

图中数据都是每秒响应次数(越高越好)。在并发用户较少的时候,96个ARM A9核心要比两种32个Xeon逻辑核心都慢一些,但随着并发用户数的增多,ARM开始反超,相比E5-2650L快了足有50%,甚至比E5-2660都快不少。

Calxeda还提供了一些优化方法,不过倒腾下来结果并没有好多少,反而还略有倒退。E5-2650L经过优化之后倒是提高了一些成绩。

再看响应时间(越低越好)。ARM仍然是在并发用户数多的时候更胜一筹,不过优化没啥效果,反而再次退步了。看起来在软件优化上,ARM路漫漫兮。

【功耗测试】

这或许将是ARM服务器最为依赖的绝招之一了,真会很省电么?

Calxeda/ARM真的做到了:每个服务器节点的平均功耗只有大约8.3W,正好符合官方宣称的6-8.5W,而待机时候仅仅5.6W,距离官方说的5W也很接近了,峰值也不过10W。

而且这些都是优化后的成果,说明尽管性能没上去,但至少功耗下来了,同样可喜可贺,而在优化前待机、平均、峰值功耗分别为6.8W、9.1W、10.5W,效果还是很明显的,尤其是待机的时候,不优化可是要比Intel更耗电的。

再考虑处理器频率、服务器空间因素,ARM相比于Xeon平均能节约功耗10%,待机时则省18%。

【价格】

Boston Viridis ARM服务器要多少钱?24节点、1.4GHz、96GB内存的一台官方标价2万美元,真的很贵。

要知道,一台戴尔R720有两颗Xeon E5-2650L、96GB内存、双万兆网络,才不过8千美元,买两台还能剩下4千。

但如果批量采购,Boston Viridis每台可以优惠到8500美元,每个节点才352美元,基本就差不多了,但在服务器采购上,一般达到20台能享受10-20%的折扣,所以此时Xeon E5的大约要6500-7200美元。

【结语】

ARM架构天生孱弱的性能决定了它不可能在速度上去比拼Intel Xeon,后者可以在几乎任何一个方面轻松完秒它,而且配置更加灵活,软件支持和优化也更为完善,生态系统羡慕死你。

Calxeda也并非不知道这一点,特别强调ECX-1000 SoC只适合初期体验,下一代基于Cortex-A15架构的同样也会如此,不会全面铺开。而根据测试,比较适合这种ARM服务器的是需要应付一定网络流量的Web服务器集群,或者流媒体服务器、存储服务器,这些CPU负载不是很高的地方,以及非常在意功耗的客户。

当然,ARM真正要在服务器领域内发威还得等待64位的ARMv8 Cortex-A50系列,Calxeda也准备届时开始爆发。ARMv8架构有很多专门针对服务器设计的地方,无疑更适合。

尽管完全无法和Xeon媲美,Calxeda ECX-1000的进步仍然堪称革命性的,如约做到每个节点8W的功耗值得赞叹,而且别忘了这只是40nm工艺的。Intel Atom性能差不多,工艺可是新的32nm。

Calxeda的下一代服务器ARM芯片组“Midway”正在开发之中,预计会在今年第三季度登场,届时会使用28nm Cortex-A15架构,单线程整数性能将比现在提升50%,可寻址内存达到16GB,当然功耗也会稍高一些。可以预料,届时的ARM服务器将能适合更多环境,包括分布式内存缓存、大型Web、中型服务器等等,而且还会支持KVM、Xen虚拟机(不过ARM真正想在虚拟机上跑起来还得等ARMv8)。

关键字:ARMweb服务器集群phpBB

本文摘自:驱动之家

x 实物来作证 ARM真能做服务器么? 扫一扫
分享本文到朋友圈
当前位置:服务器企业动态 → 正文

实物来作证 ARM真能做服务器么?

责任编辑:editor006 |来源:企业网D1Net  2013-03-20 15:08:11 本文摘自:驱动之家

称霸移动领域后,ARM试图进军并占领桌面、服务器早已经不是秘密,也有很多厂商行动起来,但从目前的迹象看,ARM服务器即便爆发最快也得等到2014年。虽然ARM架构在这几年各方面都堪称突飞猛进,但究竟能不能从Intel Xeon、AMD Opteron那里夺得一杯羹,还有待观察。

在目前已有的一些ARM服务器产品中,基本都是概念试验性质的,完全没有大规模铺开,因此想一探究竟也非常困难。又是大佬AnandTech,他们从英国Boston那里拿到了一台迄今为止堪称最为成熟的ARM服务器“Viridis”,其中使用了Calxeda专门为服务器开发的ARM SoC,并且和Intel Xeon、Atom进行了实际对比测试。

ARM服务器是骡子是马?终于第一次有了真正的评测数据。

来瞧瞧ARM服务器

这台服务器首先在外观上就很有特色,前面板赫然是红色的,在强调沉稳的服务器领域可不多见。Calxeda在这里用不同颜色来代表不同用途,红色对应云平台,橙色代表NAS应用,蓝色则是高性能集群。

注:原文中一些关于服务器零部件的介绍我们就特意略过了,重点只看处理器相关的。

前面板之后是24个2.5寸硬盘位,可以安装SATA硬盘,还有一个标准的750W 80PLUS金牌电源。

主板和普通x86服务器上的很不一样,没有任何CPU、内存插槽,而是遍布PCI-E插槽,每对插槽插上一个EnergyCard(简称EC)扩展卡,就构成了一个服务器集群。

每块EC上有4颗处理器、4条mimiDIMM内存插槽、16个SATA接口,相当于4个服务器节点。

每台服务器可以安装12块EC,那就是48个节点,不过光纤互连架构最多可以支持到4096个节点,具体多少就看怎么配置、需求几何了。

评测样机只有6块EC、24个节点。内存安装的是Netlist 4GB 1.35V ECC(PC3L-10600W-9-10-ZZ),总计24条、96GB。硬盘使用了三星MZ7PC256HAFU 256GB(类似消费级的310系列),每颗处理器对应一块,总计24块、6TB。以前的版本还有microSD卡插槽,现在取消了。

风冷散热方面做得倒是很巧妙,不过拆装起来有点费劲。

处理器名字叫做EnergyCore ECX-1000,台积电40nm工艺制造,Cortex-A9架构,四核心,主频1.1-1.4GHz,典型功耗3.8-5W。

每个核心有32KB一级指令、32KB一级数据缓存,所有核心共享4MB ECC二级缓存。普通移动处理器里一般只有1MB二级缓存,还不支持ECC。

处理器内还有优化SIMD处理的NEON扩展、独立的FPU浮点单元、TrustZone安全模块。Cortex-A9可以每时钟周期解码两条指令,并分发最多四条。这和双核心双线程的Atom差不多,但是跟Sandy Bridge Xeon E5的4-5条解码、6发射是没法比的。

真正的大杀器是功耗:Calxeda宣称,整个服务器节点在1.1GHz频率时的负载功耗最低只有5W,待机时更是区区0.5W。

服务器更离不开软件支持和优化。Calxeda在操作系统上支持Ubuntu、Fedora,不过理论上任何基于32-bit ARM Linux内核的编译版本都能够运行。Ubuntu ARM已经有了一个预编译的Highbank镜像可用。

Calxeda也在这方面投入了一些开发资源,并加入了非营利组织Linaro,旨在为ARM SoC打造开源生态系统。

截止去年底,Calxeda生态系统涵盖的操作系统、编译器、编程语言、调试器、Java、应用程序如下:

【实际应用测试】

不过上边都是理论测试,也没有发挥ARM服务器多节点、高性能光纤互连的特性。该看看真正的应用了。

Calxeda宣称,ARM服务器并非面向一般IT管理,而是适合以下四种环境:Web应用、中间层应用、离线分析、存储和文件服务。

为此假设两套服务器。Xeon方面除了两颗E5-2650L,还加入两颗E5-2660 2.2GHz/95W,同样八核心十六线程,这就总计四颗、32核心、64线程。搭配128GB内存、ESXi 5.1虚拟环境创建24个虚拟机,每个里边都假设一个PHPBB(Apache2/MySQL)网站,各自分配4个逻辑CPU核心、4GB内存,占用硬盘空间约8GB。再模拟75个并发用户,每0.6-2.4秒发送一个新的请求。监控使用vApus压力测试框架。

这相当于每秒钟有几千个用户点击十几个网站,一天下来就会有上亿次点击。实际测量网络流量峰值8Gb/s,高于典型的4-6Gb/s。

ARM方面负载相同,但用的不是虚拟机,而是24个物理节点。

图中数据都是每秒响应次数(越高越好)。在并发用户较少的时候,96个ARM A9核心要比两种32个Xeon逻辑核心都慢一些,但随着并发用户数的增多,ARM开始反超,相比E5-2650L快了足有50%,甚至比E5-2660都快不少。

Calxeda还提供了一些优化方法,不过倒腾下来结果并没有好多少,反而还略有倒退。E5-2650L经过优化之后倒是提高了一些成绩。

再看响应时间(越低越好)。ARM仍然是在并发用户数多的时候更胜一筹,不过优化没啥效果,反而再次退步了。看起来在软件优化上,ARM路漫漫兮。

【功耗测试】

这或许将是ARM服务器最为依赖的绝招之一了,真会很省电么?

Calxeda/ARM真的做到了:每个服务器节点的平均功耗只有大约8.3W,正好符合官方宣称的6-8.5W,而待机时候仅仅5.6W,距离官方说的5W也很接近了,峰值也不过10W。

而且这些都是优化后的成果,说明尽管性能没上去,但至少功耗下来了,同样可喜可贺,而在优化前待机、平均、峰值功耗分别为6.8W、9.1W、10.5W,效果还是很明显的,尤其是待机的时候,不优化可是要比Intel更耗电的。

再考虑处理器频率、服务器空间因素,ARM相比于Xeon平均能节约功耗10%,待机时则省18%。

【价格】

Boston Viridis ARM服务器要多少钱?24节点、1.4GHz、96GB内存的一台官方标价2万美元,真的很贵。

要知道,一台戴尔R720有两颗Xeon E5-2650L、96GB内存、双万兆网络,才不过8千美元,买两台还能剩下4千。

但如果批量采购,Boston Viridis每台可以优惠到8500美元,每个节点才352美元,基本就差不多了,但在服务器采购上,一般达到20台能享受10-20%的折扣,所以此时Xeon E5的大约要6500-7200美元。

【结语】

ARM架构天生孱弱的性能决定了它不可能在速度上去比拼Intel Xeon,后者可以在几乎任何一个方面轻松完秒它,而且配置更加灵活,软件支持和优化也更为完善,生态系统羡慕死你。

Calxeda也并非不知道这一点,特别强调ECX-1000 SoC只适合初期体验,下一代基于Cortex-A15架构的同样也会如此,不会全面铺开。而根据测试,比较适合这种ARM服务器的是需要应付一定网络流量的Web服务器集群,或者流媒体服务器、存储服务器,这些CPU负载不是很高的地方,以及非常在意功耗的客户。

当然,ARM真正要在服务器领域内发威还得等待64位的ARMv8 Cortex-A50系列,Calxeda也准备届时开始爆发。ARMv8架构有很多专门针对服务器设计的地方,无疑更适合。

尽管完全无法和Xeon媲美,Calxeda ECX-1000的进步仍然堪称革命性的,如约做到每个节点8W的功耗值得赞叹,而且别忘了这只是40nm工艺的。Intel Atom性能差不多,工艺可是新的32nm。

Calxeda的下一代服务器ARM芯片组“Midway”正在开发之中,预计会在今年第三季度登场,届时会使用28nm Cortex-A15架构,单线程整数性能将比现在提升50%,可寻址内存达到16GB,当然功耗也会稍高一些。可以预料,届时的ARM服务器将能适合更多环境,包括分布式内存缓存、大型Web、中型服务器等等,而且还会支持KVM、Xen虚拟机(不过ARM真正想在虚拟机上跑起来还得等ARMv8)。

关键字:ARMweb服务器集群phpBB

本文摘自:驱动之家

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^