当前位置:服务器企业动态 → 正文

还盯着POWER不放?看看天梭K1的高大上吧

责任编辑:editor007 作者:刘策 |来源:企业网D1Net  2015-01-12 20:08:56 本文摘自:it168网站

引子:古代印度的舍罕王,打算重赏国际象棋的发明者——宰相西萨。西萨向国王请求说:“陛下,我想向你要一点粮食,然后将它们分给贫困的百姓。”国王高兴地同意了。“请您派人在这张棋盘的第一个小格内放上一粒麦子,在第二格放两粒,第三格放四粒……”。千百年后的今天,我们都知道事情的结局:国王无法实现自己的承诺。这是一个长达20位的天文数字!

在北京这样的国际化大都市,你每天都能看到鳞次栉比的高楼大厦,最高的自然是位于CBD中心的国贸三期。但你可曾知道,高达330米的国贸三期在世界的排名只占到第23位,世界第一高楼哈里发塔有它两个半那么高。造高楼是一门大学问,80米高的居民楼随处可见,但是800多米高的哈里发塔只有一座。表面看起来楼的高度只提升了10倍,但设计与制造难度却提升了千百倍。这也说明一个问题,任何一个事物想“搞大”都是比较难的,特别是达到顶尖水平的那种大。

高端容错计算机就要玩“大”的

当年天河一号勇夺TOP500冠军的时候,网上除了赞美之声,更多是网友的质疑,许多人更认为它是“堆出来的超算”。正如我们刚刚举例的高楼一样,同样的钢、水泥和砖瓦,我们为什么不能“堆”一座更高的高楼?道理大家都明白,人家的世界第一除了这些原材料之外,更重要的是整体的设计,包括框架结构、受力分析、抗震要求等等。同样的道理也适用于超级计算机,你怎么把计算、存储、网络等部件有机的结合起来,实现高度的运转?这里面同样存在设计的问题,而且还是大问题。

还盯着POWER不放?看看天梭K1的高大上吧

几天前,国家召开了科学技术奖励大会,天河一号获得国家科学技术进步奖特等奖;而在同时颁布的国家科技进步奖中,赫然出现了“高端容错计算机”的身影。所谓高端容错计算机是一类高性能、高可靠的高端服务器,比如IBM的POWER和HP的SuperDome。这种设备通常应用在电信、银行等关键领域,但由于这些设备都来自国外,如果有人蓄意利用后门谋求达成非正当目的,尤其是在有政府介入的情况下,将对国家安全造成重大威胁。为此,国家863计划设立了十一五期间863重大专项“高端容错计算机系统关键技术与应用”,就是为了实现在关键业务应用上的自主可控。

带兵打仗并不是越多越好

自主可控,说起来简单做起来难。长久以来国内服务器市场都是以x86服务器作为主要方向,所能实现的最高只能达到8路水平,也就是8颗处理器协同工作。一旦超过了这个上限,所面临的就将是多处理器协调工作的问题。

上尝从容与信言诸将能否,各有差。上问曰:“如我,能将几何?”信曰:“陛下不过能将十万。”上曰:“于君何如?”曰:“臣多多益善耳。——《史记·淮阴侯列传》

还盯着POWER不放?看看天梭K1的高大上吧

2000多年前,刘邦与韩信曾有一番关于领兵能力的对话,韩信自诩能够“多多益善”。对于指挥官来说,都存在指挥能力的问题。你如何能保证大军听从你的调动,如何能保证各个部队的统一协作,如何能保证打胜仗?可见带兵打仗并不是越多越好。

同样的道理也适用于服务器设计。使用更多的处理器一定能提升性能吗?真不一定。首先要考虑的就是多处理器协同工作的问题。处理器要协同工作,相互之间必然要通讯,而且处理器之间不仅要进行数据传递,更要保持数据一致,任何数据异步都可能会造成系统停机,这使得处理器通讯远比一般性的通讯技术更为复杂。随着处理器数量的增加,处理器间的通讯强度会呈指数形式增加,甚至是失控。

即便是处理器能够协同工作,如何实现高效、稳定的工作也是一个问题,要知道处理器通讯的“内耗”是相当严重的。处理器完成一次本地通讯需要的时间是完成一次计算任务的200-300倍,如果是相邻节点的通讯则需要400-600倍的时间,如果采用一般的处理器协同技术,当处理器数量超过8颗以后,大量的处理器资源都被通讯占用,继续增加处理器数量时,性能提高就会十分有限。由此看来,系统增大一个量级,随之带来的问题就会被放大上百倍。

走在一条前人没有走过的路上

既然原来的架构不行,那就试试新架构吧,当然也是一件非常艰难的事情。在数百名工程师历时4年的共同努力下,最终设计实现了“双翼可扩展多处理器紧耦合共享存储器体系结构”,解决了多处理器的互联问题,最大能够支持64颗处理器。据负责研发的浪潮集团首席科学家王恩东透露,该技术的特点在于只需要一级跳步(数据经过一个协同芯片就称为一个跳步,跳步越多系统的延迟也就越多),保证了系统具有良好的线性扩展性,处理器间的互联通道能够随着处理器数量的增长而不断增长,而且整体互联结构相对简单。

还盯着POWER不放?看看天梭K1的高大上吧

除此之外,研发人员还创建了“三级目录两级缓存一致性域协议”,保证处理器数量增加时,系统通讯规模和复杂度仅有较小增加,上述两项技术结合起来,使得系统性能可以近线性提升,达到了国际领先水平。现在回头看看,在研制过程中,浪潮共申请发明专利 1147项,大大填补了该领域的科技空白。

新架构的出现的确振奋人心,但还远远不够。如果仍以盖楼举例的话,新架构只是实现了基础框架的设计,保证了高楼能够建造起来;但是高楼能够承重多少、抗震多少还是需要解决的问题,这在计算机领域叫做——可用性。

还盯着POWER不放?看看天梭K1的高大上吧

高端容错计算机是专门承担关键应用系统的系统平台,一旦出现停机事故,造成巨大的损失。2012年2月2日,日本东京证券交易所,因承载交易系统的关键应用主机发生故障,包括索尼和东京电力在内的241支股票暂停交易。所以,能够提供99.999%的高可用性,可以7*24小时不间断运行是高端容错计算机最基本的应用需求。

99.999%是什么概念?——每年宕机时间5分钟。听起来挺难,做起来更加难。要知道,目前品质最高的工业级电子器件平均无故障时间在10000小时左右。另外,高端容错计算机的BIOS等底层代码有几千万行。据权威的Coverity Analysis集团数据显示,目前企业软件的缺陷密度为 0.72,也就是平均每1000行代码中会有0.72个缺陷,而任何一处不良代码都是潜在的隐患。换句话说,无论在硬件还是软件层面,要想实现99.999%的高可用性都要付出巨大的努力。

还盯着POWER不放?看看天梭K1的高大上吧

为此,研究人员创建了多层次冗余与故障管理容错系统模型,在芯片、模块、固件、操作系统、业务应用层面全面采用冗余设计以杜绝单点故障,采用故障诊断、隔离和恢复的全流程自动处理技术,系统可自我修复,整体可用度超过99.9994%。或许用一个实际的数字能够更好表现这些功能的价值——建设银行新疆区分行启动上线测试以来,已经稳定运行1500余天。

如今,高端容错计算机已经在建设银行新疆分行、广东分行,中国邮政储蓄银行,中国进出口银行,洛阳银行,国家电网,农业部、安徽社保等多个金融、能源、政府等领域投入实际应用。由浪潮牵头成立的国产主机系统产业联盟成员也达到了58家,覆盖了芯片、主机、数据库、中间件等各个产业环节,初步构建起中国的高端计算机产业链。

关键字:缺陷密度天梭

本文摘自:it168网站

x 还盯着POWER不放?看看天梭K1的高大上吧 扫一扫
分享本文到朋友圈
当前位置:服务器企业动态 → 正文

还盯着POWER不放?看看天梭K1的高大上吧

责任编辑:editor007 作者:刘策 |来源:企业网D1Net  2015-01-12 20:08:56 本文摘自:it168网站

引子:古代印度的舍罕王,打算重赏国际象棋的发明者——宰相西萨。西萨向国王请求说:“陛下,我想向你要一点粮食,然后将它们分给贫困的百姓。”国王高兴地同意了。“请您派人在这张棋盘的第一个小格内放上一粒麦子,在第二格放两粒,第三格放四粒……”。千百年后的今天,我们都知道事情的结局:国王无法实现自己的承诺。这是一个长达20位的天文数字!

在北京这样的国际化大都市,你每天都能看到鳞次栉比的高楼大厦,最高的自然是位于CBD中心的国贸三期。但你可曾知道,高达330米的国贸三期在世界的排名只占到第23位,世界第一高楼哈里发塔有它两个半那么高。造高楼是一门大学问,80米高的居民楼随处可见,但是800多米高的哈里发塔只有一座。表面看起来楼的高度只提升了10倍,但设计与制造难度却提升了千百倍。这也说明一个问题,任何一个事物想“搞大”都是比较难的,特别是达到顶尖水平的那种大。

高端容错计算机就要玩“大”的

当年天河一号勇夺TOP500冠军的时候,网上除了赞美之声,更多是网友的质疑,许多人更认为它是“堆出来的超算”。正如我们刚刚举例的高楼一样,同样的钢、水泥和砖瓦,我们为什么不能“堆”一座更高的高楼?道理大家都明白,人家的世界第一除了这些原材料之外,更重要的是整体的设计,包括框架结构、受力分析、抗震要求等等。同样的道理也适用于超级计算机,你怎么把计算、存储、网络等部件有机的结合起来,实现高度的运转?这里面同样存在设计的问题,而且还是大问题。

还盯着POWER不放?看看天梭K1的高大上吧

几天前,国家召开了科学技术奖励大会,天河一号获得国家科学技术进步奖特等奖;而在同时颁布的国家科技进步奖中,赫然出现了“高端容错计算机”的身影。所谓高端容错计算机是一类高性能、高可靠的高端服务器,比如IBM的POWER和HP的SuperDome。这种设备通常应用在电信、银行等关键领域,但由于这些设备都来自国外,如果有人蓄意利用后门谋求达成非正当目的,尤其是在有政府介入的情况下,将对国家安全造成重大威胁。为此,国家863计划设立了十一五期间863重大专项“高端容错计算机系统关键技术与应用”,就是为了实现在关键业务应用上的自主可控。

带兵打仗并不是越多越好

自主可控,说起来简单做起来难。长久以来国内服务器市场都是以x86服务器作为主要方向,所能实现的最高只能达到8路水平,也就是8颗处理器协同工作。一旦超过了这个上限,所面临的就将是多处理器协调工作的问题。

上尝从容与信言诸将能否,各有差。上问曰:“如我,能将几何?”信曰:“陛下不过能将十万。”上曰:“于君何如?”曰:“臣多多益善耳。——《史记·淮阴侯列传》

还盯着POWER不放?看看天梭K1的高大上吧

2000多年前,刘邦与韩信曾有一番关于领兵能力的对话,韩信自诩能够“多多益善”。对于指挥官来说,都存在指挥能力的问题。你如何能保证大军听从你的调动,如何能保证各个部队的统一协作,如何能保证打胜仗?可见带兵打仗并不是越多越好。

同样的道理也适用于服务器设计。使用更多的处理器一定能提升性能吗?真不一定。首先要考虑的就是多处理器协同工作的问题。处理器要协同工作,相互之间必然要通讯,而且处理器之间不仅要进行数据传递,更要保持数据一致,任何数据异步都可能会造成系统停机,这使得处理器通讯远比一般性的通讯技术更为复杂。随着处理器数量的增加,处理器间的通讯强度会呈指数形式增加,甚至是失控。

即便是处理器能够协同工作,如何实现高效、稳定的工作也是一个问题,要知道处理器通讯的“内耗”是相当严重的。处理器完成一次本地通讯需要的时间是完成一次计算任务的200-300倍,如果是相邻节点的通讯则需要400-600倍的时间,如果采用一般的处理器协同技术,当处理器数量超过8颗以后,大量的处理器资源都被通讯占用,继续增加处理器数量时,性能提高就会十分有限。由此看来,系统增大一个量级,随之带来的问题就会被放大上百倍。

走在一条前人没有走过的路上

既然原来的架构不行,那就试试新架构吧,当然也是一件非常艰难的事情。在数百名工程师历时4年的共同努力下,最终设计实现了“双翼可扩展多处理器紧耦合共享存储器体系结构”,解决了多处理器的互联问题,最大能够支持64颗处理器。据负责研发的浪潮集团首席科学家王恩东透露,该技术的特点在于只需要一级跳步(数据经过一个协同芯片就称为一个跳步,跳步越多系统的延迟也就越多),保证了系统具有良好的线性扩展性,处理器间的互联通道能够随着处理器数量的增长而不断增长,而且整体互联结构相对简单。

还盯着POWER不放?看看天梭K1的高大上吧

除此之外,研发人员还创建了“三级目录两级缓存一致性域协议”,保证处理器数量增加时,系统通讯规模和复杂度仅有较小增加,上述两项技术结合起来,使得系统性能可以近线性提升,达到了国际领先水平。现在回头看看,在研制过程中,浪潮共申请发明专利 1147项,大大填补了该领域的科技空白。

新架构的出现的确振奋人心,但还远远不够。如果仍以盖楼举例的话,新架构只是实现了基础框架的设计,保证了高楼能够建造起来;但是高楼能够承重多少、抗震多少还是需要解决的问题,这在计算机领域叫做——可用性。

还盯着POWER不放?看看天梭K1的高大上吧

高端容错计算机是专门承担关键应用系统的系统平台,一旦出现停机事故,造成巨大的损失。2012年2月2日,日本东京证券交易所,因承载交易系统的关键应用主机发生故障,包括索尼和东京电力在内的241支股票暂停交易。所以,能够提供99.999%的高可用性,可以7*24小时不间断运行是高端容错计算机最基本的应用需求。

99.999%是什么概念?——每年宕机时间5分钟。听起来挺难,做起来更加难。要知道,目前品质最高的工业级电子器件平均无故障时间在10000小时左右。另外,高端容错计算机的BIOS等底层代码有几千万行。据权威的Coverity Analysis集团数据显示,目前企业软件的缺陷密度为 0.72,也就是平均每1000行代码中会有0.72个缺陷,而任何一处不良代码都是潜在的隐患。换句话说,无论在硬件还是软件层面,要想实现99.999%的高可用性都要付出巨大的努力。

还盯着POWER不放?看看天梭K1的高大上吧

为此,研究人员创建了多层次冗余与故障管理容错系统模型,在芯片、模块、固件、操作系统、业务应用层面全面采用冗余设计以杜绝单点故障,采用故障诊断、隔离和恢复的全流程自动处理技术,系统可自我修复,整体可用度超过99.9994%。或许用一个实际的数字能够更好表现这些功能的价值——建设银行新疆区分行启动上线测试以来,已经稳定运行1500余天。

如今,高端容错计算机已经在建设银行新疆分行、广东分行,中国邮政储蓄银行,中国进出口银行,洛阳银行,国家电网,农业部、安徽社保等多个金融、能源、政府等领域投入实际应用。由浪潮牵头成立的国产主机系统产业联盟成员也达到了58家,覆盖了芯片、主机、数据库、中间件等各个产业环节,初步构建起中国的高端计算机产业链。

关键字:缺陷密度天梭

本文摘自:it168网站

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^