当前位置:CIOCIO联盟 → 正文

布局数据之基,赢战未来商业

责任编辑:cres |来源:企业网D1Net  2021-10-22 15:03:45 原创文章 企业网D1Net

10月22日,由企业网D1Net、中国企业数字化联盟、信众智CIO智力输出及社交平台共同主办的2021全国工业互联网CIO大会暨《2021工业互联网白皮书》发布会在浙江 • 嘉兴举办。本次大会以“工业互联网落地实践”为主题,汇集约200家制造业CIO和IT主管,以及多家一线工业互联网领域的解决方案提供商,共同探讨工业互联网在企业应用实践中的突出问题,寻求破解之道。《2021工业互联网白皮书》同期在会上重磅发布,为我国工业互联网的发展再添助力,为广大制造业企业的数字化创新实践提供参考依据。
 
以下是现场速记。



川源AFA技术及生态副总裁 翁国唐
 
翁国唐:各位下午好,谢谢范总,也谢谢各位今天下午莅临,非常荣幸代表上海川源在这边跟大家交流。
 
我今天要讲的是布局数据之基,赢战未来商业。川源是一间国产全闪存阵列的品牌,一直致力于提供给用户最好的数据访问的体验,最安全的数据管理的保护机制。川源在上还有一个研发中心,成都有一个研发中心,台北也有一个研发中心,目前在北京、上海、成都、厦门四个地方都有办事处或者是分公司,现在在新加坡跟英国、日本、美国都构建了办事处,去辐射全球的销售服务。
 
目前川源在全球获得了700多个专利,2016年获得全球闪存峰会最创新闪存科技大奖,这个奖项非常难得,也是国外在闪存业绩的专家对于川源技术的认可。同时,我们在今年中国闪存峰会里面得到了中国闪存存储的企业金奖。技术的该度来看,川源的全闪存存储,目前在全球的性价比排名,依然可以排全球的前几名,现在还是可以排在全球的第一名。在技术的深度上,我们也是目前国内少数可以跟海外的头部企业,比如说戴尔EMC,或者是惠普做技术上对比的公司。川源的技术完全由自己的团队来做核心技术的研发,所以我们也是完全可以做到自主研发的能力。
 
总的来讲,川源的技术,是透过自己研发的专利核心技术,来去引导用户得到更好的存储的数据访问体验,我们的核心技术叫FlexiRemap,首先我们可以提供极致稳定的过性能,这个高性能的体验,体现在于用户在访问过程当中,包含了数据存储反应的时间,或者是响应的时间,或者是在一些高性能、高并发的场景里面可以得到更快速的数据运行的能力。FlexiRemap底层独特的写入管理技术,可以协助用户取得更好的性能发挥。我们在数据收到的过程当中,拆分成好几个4KB的小数据,符合闪存科技底层落盘时的特性。同时我们拆分的过程当中产出了多层次的映射表做到数据的访问,这样我们数据写入的过程当中,可以对用户来讲,既享有传统架构下数据保护的价值,同时又可以带来条带式的写入,线性性能堆叠的效应。
 
大家可以看到,经过我们这样的拆分,按照底层的SSD可用的状况做一个重新的排序之后,写到底层SSD上的时候,会变成平均打散在底层的每一个SSD上。我们知道现在市场上有很多常见的全闪存阵列的产品,基于RAID的技术做到RAID2.0的优化,这个优化也是想要做到平均分散在每一个SSD上的写入,但是颗粒度可能只能做到Block的层级,我们可以做到Page的层级,我们可以做到更细致一些,性能的支撑上也会更好。
 
这是跟传统的技术做一个对比,在我们的产品上,通过我们的技术去实现写入的分散之后,我们有效地利用每一个SSD做到性能的堆叠,让每一个SSD的写入,写入的状况是一致的,不至于有所为的热点盘产生。如果今天发生了热点盘的现象,首先带来的第一个影响,有热点盘的话,这些热点盘大概会成为整个存储设备性能的瓶颈。
 
第二件事情,这个热点盘可能比较早到达寿命的上限,川源在技术层面上完全避免了这个热点盘的问题。
 
我们的产品上面,一般市场上看到的存储设备大概是24个盘位的设计,革委会看到,在我们的设备上面,左侧SSD写入的状态都会相当平均,右侧用传统RAID的技术,还是会有热点盘的产生,热点盘的SSD会成为阵列性能的瓶颈,同时也会造成热点盘的SSD比较早到达他的寿命的上线。
 
川源是目前全球唯一一家我们不需要依靠缓存技术就可以把这个存储的性能做到100万的级别,目前市场上常见的,不管是海外的品牌,或者是国内的品牌,大部分还是需要依靠大量的缓存的技术,您看到的可能是四个或者是八个控制器线性的堆叠,川源核心的技术,100%发挥了SSD应该要有的性能,不利用缓存机制的模式下,就可以把性能做到100万的Iops的级别,未来在2.0的产品,通过集群可扩展式集群的表现,可以把性能做到2000万,甚至是5000万lops的级别。
 
接下来我们提供的是极致的高可靠性,数据在使用的过程当中,除了性能希望很快之外,最重要的一件事情,是数据的可靠度,不能因为追求性能而丧失了数据的可靠度,万一有数据丢失的问题,服务中断的问题,对企业的影响都是非常大的。因为我们自己研发的FlexiRemap技术,可以在发生故障的时候,可以把这个群组锁定成只读模式,避免进一步崩溃,造成数据丢失的问题。传统的RAID技术,因为他们并不具备多层次映射表的设计,当数据保护群组里面发生故障时,还会持续让数据往已经有故障的群组里面写,很容易造成第二块盘,第三块盘进一步故障,导致数据的崩溃。在我们的数据上,把已经不健康的群组先锁定成只读的模式,通过映射表的机制,把这个数据全部引导到健康的群组做一个写入,这样就可以避免已经有故障的群组进一步崩溃,导致数据丢失的问题。
 
同时,提供用户对称式双活高可靠度的设计,因为我们都知道,SSD和机械硬盘有不一样的特性,SSD出厂的时候就有一个寿命上限,这个寿命是取决于他的可擦写的次数。传统的磁盘阵列的设计通常是两个控制器带一个存储池,带一个磁盘柜,但是在全闪存阵列的时代,如果还保有这样的设计,风险不是存在于控制器上,而是存在于磁盘柜上,因为SSD的寿命万一到达了上限,是没办法进行访问的。再加上刚刚所提到的,如果你采用的是RAID技术,可能会有热点盘,热点盘会导致有几块SSD寿命,基本上会在同一个时间到达寿命上限。万一你今天这个存储池里面同时发生了两到三块SSD的故障,其实你的上层的控制器有多少个都没有用。川源看到了SSD的特性,所以我们是真正对称式双活的高可靠度的设计,我们给到客户是两个独立的存储设备,通过我们的高速的接口,来实现实时数据同步,对于用户来讲,不管是存储设备上的控制器故障,或者是单一存储设备上的存储池发生大规模的SSD的失效或者是故障,都不会造成业务访问中断,因为我们还有另外一个设备作为实时的备源,可以提供给你直接的业务的支撑,确保你的业务运行不会有中断的问题。通过这个设计,可靠度可以做到六个九,一整年里面需要防范的故障的风险是低于31秒的。
 
同时在两个设备之间的实时数据同步,我们依靠自己专利的技术设计,在双副本的情况下,依然可以把延时维持在一毫秒以内,中间不需要经过缓存的技术进行数据的同步,确保使用的过程当中,不会因为突然的断电造成数据的丢失。
 
FlexiRemap给客户带来的第三个价值,在于超长存储生命周期,过去大家用磁盘阵列考虑这个设备买回来,大概要用五到七年左右的时间,到了七年左右,五年到七年左右,开始评估我要去更换下一代的产品,如果你用的是传统的RAID技术,搭配现在所谓的SSD闪存新的存储介质,你会发现也许不到五年,你可能就会开始要陆续更换这里面的SSD。因为RAID技术搭配SSD的时候,会造成底层SSD的寿命进一步被缩短。正常来讲,一般各位在企业内部可能用一些数据库的应用,或者是虚拟化的应用,三到四年左右的时间,就会面临SSD里面的固态硬盘进行更换的问题。
 
川源通过自己的专利技术,我们可以去有效地延长SSD的使用寿命。专利技术我们可以通过自动学习数据使用状况优化数据存放位置,这个是为了去符合SSD的特性,如果他在旧有的页面上的数据进行更新的时候,并不是直接像硬盘一样,在同一个位置做擦写的动作,而是找到一个新的位置,把新的数据写入,旧的位置标志成无效的数据。可是这个无效的数据在你进行所谓的垃圾回收,空间释放的过程之前,其实是没办法使用的。什么时候进行垃圾回收呢?各位看到,这个图最左边这一排是Block,这里面大部分的数据都变红的时候,就会自动进行垃圾的回收,或者是另外一个情形,红色和绿色格子交错用满的时候,被迫要去找一个承载红色的Block进行垃圾的回收。川源通过自动学习的机制,把这些最经常被更新的数据集中放在一个Block里面去存放,让我们在SSD执行垃圾回收时所得到的负担是非常小的。各位可以看一下,通过川源的自动学习的机制,我们把经常被更新的数据集中在一起存放的时候,SSD要进行垃圾回收的时候,可以找到Block里面大部分都是无效的数据,只有很少量的有效数据,这样要进行垃圾回收的时候,只需要把很少量的有效数据做一个搬动,其他无效的数据可以直接清掉,这个时候对于SSD来讲,性能就比较不会受到影响,同时寿命也不会受到影响。传统的RAID技术,因为缺少了自动学习的机制,颗粒被用满,被迫要进行垃圾回收时,里面会承载很多绿色有效的数据。这个时候就会让SSD忙碌地搬动这些数据,导致SSD的性能下降。因为你要重复把这些绿色的数据重写一次,就导致了SSD的寿命进一步下降。我们会说传统的RAID技术,搭配SSD的时候,往往会让SSD的寿命缩减40-60%。一般期待用五到七年的SSD,在搭配RAID技术时,可能三年、三年半就会开始陆续更换SSD。但是在川源的设计之下,可以确保SSD生命周期被延长,用户使用我们的技术搭配SSD的时候,可以使用七年到十年的生命周期,可以恢复到过去采购机械硬盘磁盘阵列时所预期的一个设备用七年,甚至更长。
 
下面是我们一个评测的结果,各位可以看一下,这个评测怎么做?我们用相同的平台,用了八块200G的SSD,堆叠出大约是1.6TB的容量。测试的方式是什么?我们每一天把1.6TB的空间写满三次,我们连续测半年,观察SSD耗损的状况,最后再推算出SSD大概可以使用多久。通过这样的测评我们可以发现,第一个,对于SSD来讲,1.6TB的SSD,使用到他的寿命上限为主,可以写入的总数据量是大于4.8PB的,这是搭载我们FlexiRemap技术的时候。如果是传统的RAID技术,总共可写入数据量是小于2.8TB。如果每一天重复去写这个数据,写三次,把1.6TB写满三次,在FlexiRemap技术下,依然可以保证你使用超过4.5年,但是我们都知道,每一天把这个容量,存储设备的容量写满三次,这是非常极端的行为,一般数据库的应用场景,或者是虚拟化的应用场景,或者是容器的应用场景下,其实你的SSD的写入次数可能是不到0.7,不到0.5的。但是在这样极致的场景下,我们都可以用到4.5年,一般的应用场景下,基本上可以保证使用7-10年都没问题。如果是使用RAID5的技术,在这么极致的耗损之外,可能用不到两年,就要进行整批量的更换。
 
另外FlexiRemap提供了丰富的存储功能,提供给企业用户各种不同的应用场景,可以有效地运用它。首先包含了自动精简配置,还有高级的数据的精简功能,闪存现在对于各位来讲,有很多客户还在观望,原因是因为闪存的价格相对来讲是比较高的,相较于一般的磁盘阵列来说,闪存的费用还是比较高。我们在数据库,或者是虚拟化,或者是桌面虚拟化的应用场景里面,通过我们的数据的去重和压缩,或者是深度的去重和压缩的技术,我们是有办法协助用户,去把实际上落盘的数据量做到进一步的精简。在数据库的应用场景里面,最高的能力大概可以做到4:1,一个10TB的数据库,在我的全闪存阵列上只耗损2.5TB的容量。如果在虚拟化或者是桌面虚拟化的场景里面,大概可以做到5:1,甚至是10:1的环节,确保用户在采购全闪存阵列的时候,可以不需要按照实际的需要采购,可以通过压缩和去重的技术,买一个相对容量较小的全闪存阵列,协助你节省成本。
 
另外我们也提供了本地的快照,克隆,或者是备份到外部的存储设备,或者是备份到共有云,或者是通过川源自带的接口,实现远程的复制,确保你的这些数据组能够有多个副本,不至于因为本地IT机房发生故障,或者是发生勒索中毒的问题,导致你的业务停摆。我们都可以通过外部的备份的文件,备份的镜像,把系统还原到没有中毒,没有被黑客入侵前的状态。这些技术我们也是采用最新的设计,执行这些设计的过程当中,不会对于系统的IO造成太大的负载,我们可以确保备份的过程时间是非常短的,对于前端业务场景的影响,不会有太大的问题,
 
同时,我们的产品也支持WMware,OpenStack和K8S的支持,可以是现在虚拟化平台下一站是的管理的机制,通过K8S插件的支持,可以实现现在各位在做容器应用场景开发过程当中,把川源当成一个持久性的存储,协助你们在各种不同的应用场景的开发过程当中,如果有迭代更新的需求时,你可以使用原有的数据来去进行不同版本的测试和实验。
 
接下来跟各位介绍一下川源的全闪存阵列目前在制作也当中的应用场景有哪些,首推的是数据库的应用,因为数据库本身就是大量的细碎的数据的使用,数据库的应用场景里面选择上海川源的有五个理由。一是性能非常好,我们在数据库的应用场景里面可以提供超过250万TPM的性能。第二个是免停机,而且非常高的可靠度,因为我们的对称式双活搭配上层,不管是Oracle的RAC或者是集群架构,都可以实现所谓的近端的数据库双活的方案。第三个是通过数据减量的方式降低你在存储设备上的采购成本。
 
第四是投资报酬与维护成本上,原因是因为川源的全闪存阵列目前在全球的性价比排名非常靠前,我们在整体的运维成本上,也可以协助用户进一步降低,我们可以把SSD寿命延长得非常长,采购川源设备之后,七年甚至十年的时间,都不需要对这个设备进行SSD的更换,可以降低设备维护上投入的硬件成本。第五个特色是操作简单,他的架构也很单纯,我们基本上兼容国内大部分数据库主流的架构,而且你不需要进行任何的调整,只需要单纯把原有的设备升级成川源的全闪存阵列,就可以体验到性能上的提升。
 
这边是评测的数据,左边是采用Oracle的数据库搭配20颗企业级SAS万转硬盘性能表现,大概是在48万次左右,右边是把同样的环境,存储设备升级成川源的全闪存阵列,立刻升级到了240万次左右的TB,每分钟在线数据交易量,这个240万次还不到川源存储性能的极限,我们自己内部实际去评测过,这样的性能只耗用了川源性能的1/10。
 
这个架构就是所谓的服务不中断,我们通过我们的对称式双活,两台设备部署在不同的机柜,或者是在近端机房,不同的机房里面,可以去做到搭配上层的Oracle的RAC服务器,可以做到服务不中断的功能。在这样的设计之下,即便是一个机柜里面突然的断电,或者是链路突然掉线,都不会有数据库停机的问题,因为另外一套机柜里面的设备都还能提供实际运行服务。
 
在制造业里面,其实我们有蛮多客户,他们最后选择MES系统里面的数据库运行在川源的全闪存阵列上,通过我们的性能做到MES生产执行系统里面良率分析效率的提升,数据清洗效率的提升。
 
这个是某一个客户导入之后的效益,以前做良率报表统计,数据库查询的过程当中,耗时比较长一点,通过全闪存阵列做到性能的升级,提升的效率大概有6倍、18倍、90倍的时间,可以大幅缩短生产管理人员做良率分析时耗用的时间。
 
另外跟各位分享一下,我们在苏州地区有一个实际的客户,在MES系统里面做过实测,对比的是蛮知名的海外品牌,品牌的名字我就不透露了,这个客户是苹果的一个供应商,他要做的事情其实很简单,MES系统需要让苹果来做良率的查询,整个测试的方法,把两边的环境搭配一样的客户端做一个对比,各位可以看到,川源这边的产品,能够响应的时间比原有海外知名的品牌全闪存阵列产品来得短很多。像检索的时间,川源只花到差不多2秒以内的时间就可以完全响应出来。
 
另外是丰田汽车,或者是优衣库在越南的生产工厂,也用了川源的产品服务他们的MES系统的工具,也做到一些大数据分析的应用。
 
同时我们也支持虚拟化和云计算的应用,像我们的虚拟化这一块儿,支持了VMware VAAI及Windows ODX插件,这个跟传统的厂商他们支持这两个不一样,我们支持的过程当中协助各位做了一个去重,让我们在克隆虚机的时间可以打幅缩短。有一个知名的大学,通过导入全闪存阵列,原本要花好几个小时才能把虚机做完克隆,现在通过这个技术,可以把时间缩短到几分钟。备份和还原的时间原本也是几个小时,做完之后,缩短到大概20分钟。每分钟在线数据交易量原本只有20几万,通过我们的产品,可以把这个性能提升到130多万。
 
另外在AI人工智能的应用场景里面,像是刚刚所提到的,我们有跟容器做一些对接,我们也跟生态圈的合作伙伴一起合作打造了一个AI-Stack专用的算力云。里面很简单,高性能的计算,人工智能、机器学习的过程当中所需要的高并发的场景,通过川源的全闪存阵列协助做到加速,如果是海量数据的话,采用市场上分布式的解决方案,这些数据以对象存储的方式做一个分配。机器学习的平台,上手之后其实很快,其实不太需要人工智能的开发人员做太多的操作系统的部署,或者是算力框架的部署,只需要在平台上点击他所需要的算力的资源,这个平台就可以快速的把这个资源交付到这些人工智能的开发人员手上,他可以快速地进行不同版本的比较,不同版本的学习,而且可以无缝衔接人工智能和机器学习开发人员他们常用的工具,意味着就不需要重新再去学习这些工具,可以快速享受。
 
通过这些平台,GPU的服务器搭配川源的全闪存阵列产品,再加上环境,我们协助国内头部的人工智能的企业,做到算法训练耗时的缩短,缩短的耗时是30%左右。左边是川源的全闪存阵列,执行他们的框架测试时所需要的耗损的时间,对比他原本使用Lustre高性能计算的集群环境,或者是采用开源CEPH分布式的场景,都可以把时间缩得非常短。
 
他们给到我们的评价,目前是他们实测过所有存储产品里面效果最好的,其实我们在我们的存储设备上,也把他们在业务网所使用的网络环境的带宽上限,测到一个极限。他今天把业务网的网络环境再做一个升级的话,算法训练的耗时还可以进一步缩短。
 
我们都知道工业互联网,数据是至关重要的事情,川源希望通过我们的专利技术,协助各位在建立数据应用平台,应用场景时,可以依靠川源的技术,获得更好的效率的提升,获得更高的可靠度,保障业务持续运行。早上余总提到的数字孪生,或者是自动化的生产,大部分都是需要依靠大量数据的交互作用,甚至自动化生产的过程当中,有一些人工智能的机器学习,要去做到流程的改善,都可以通过川源的产品协助各位做到效率的加分。
 
感谢各位的时间,希望会后如果有需求的话,川源的摊位就在外面,靠近电梯口的地方,欢迎各位到我们的摊位多多交流,谢谢!

关键字:存储

原创文章 企业网D1Net

x 布局数据之基,赢战未来商业 扫一扫
分享本文到朋友圈
当前位置:CIOCIO联盟 → 正文

布局数据之基,赢战未来商业

责任编辑:cres |来源:企业网D1Net  2021-10-22 15:03:45 原创文章 企业网D1Net

10月22日,由企业网D1Net、中国企业数字化联盟、信众智CIO智力输出及社交平台共同主办的2021全国工业互联网CIO大会暨《2021工业互联网白皮书》发布会在浙江 • 嘉兴举办。本次大会以“工业互联网落地实践”为主题,汇集约200家制造业CIO和IT主管,以及多家一线工业互联网领域的解决方案提供商,共同探讨工业互联网在企业应用实践中的突出问题,寻求破解之道。《2021工业互联网白皮书》同期在会上重磅发布,为我国工业互联网的发展再添助力,为广大制造业企业的数字化创新实践提供参考依据。
 
以下是现场速记。



川源AFA技术及生态副总裁 翁国唐
 
翁国唐:各位下午好,谢谢范总,也谢谢各位今天下午莅临,非常荣幸代表上海川源在这边跟大家交流。
 
我今天要讲的是布局数据之基,赢战未来商业。川源是一间国产全闪存阵列的品牌,一直致力于提供给用户最好的数据访问的体验,最安全的数据管理的保护机制。川源在上还有一个研发中心,成都有一个研发中心,台北也有一个研发中心,目前在北京、上海、成都、厦门四个地方都有办事处或者是分公司,现在在新加坡跟英国、日本、美国都构建了办事处,去辐射全球的销售服务。
 
目前川源在全球获得了700多个专利,2016年获得全球闪存峰会最创新闪存科技大奖,这个奖项非常难得,也是国外在闪存业绩的专家对于川源技术的认可。同时,我们在今年中国闪存峰会里面得到了中国闪存存储的企业金奖。技术的该度来看,川源的全闪存存储,目前在全球的性价比排名,依然可以排全球的前几名,现在还是可以排在全球的第一名。在技术的深度上,我们也是目前国内少数可以跟海外的头部企业,比如说戴尔EMC,或者是惠普做技术上对比的公司。川源的技术完全由自己的团队来做核心技术的研发,所以我们也是完全可以做到自主研发的能力。
 
总的来讲,川源的技术,是透过自己研发的专利核心技术,来去引导用户得到更好的存储的数据访问体验,我们的核心技术叫FlexiRemap,首先我们可以提供极致稳定的过性能,这个高性能的体验,体现在于用户在访问过程当中,包含了数据存储反应的时间,或者是响应的时间,或者是在一些高性能、高并发的场景里面可以得到更快速的数据运行的能力。FlexiRemap底层独特的写入管理技术,可以协助用户取得更好的性能发挥。我们在数据收到的过程当中,拆分成好几个4KB的小数据,符合闪存科技底层落盘时的特性。同时我们拆分的过程当中产出了多层次的映射表做到数据的访问,这样我们数据写入的过程当中,可以对用户来讲,既享有传统架构下数据保护的价值,同时又可以带来条带式的写入,线性性能堆叠的效应。
 
大家可以看到,经过我们这样的拆分,按照底层的SSD可用的状况做一个重新的排序之后,写到底层SSD上的时候,会变成平均打散在底层的每一个SSD上。我们知道现在市场上有很多常见的全闪存阵列的产品,基于RAID的技术做到RAID2.0的优化,这个优化也是想要做到平均分散在每一个SSD上的写入,但是颗粒度可能只能做到Block的层级,我们可以做到Page的层级,我们可以做到更细致一些,性能的支撑上也会更好。
 
这是跟传统的技术做一个对比,在我们的产品上,通过我们的技术去实现写入的分散之后,我们有效地利用每一个SSD做到性能的堆叠,让每一个SSD的写入,写入的状况是一致的,不至于有所为的热点盘产生。如果今天发生了热点盘的现象,首先带来的第一个影响,有热点盘的话,这些热点盘大概会成为整个存储设备性能的瓶颈。
 
第二件事情,这个热点盘可能比较早到达寿命的上限,川源在技术层面上完全避免了这个热点盘的问题。
 
我们的产品上面,一般市场上看到的存储设备大概是24个盘位的设计,革委会看到,在我们的设备上面,左侧SSD写入的状态都会相当平均,右侧用传统RAID的技术,还是会有热点盘的产生,热点盘的SSD会成为阵列性能的瓶颈,同时也会造成热点盘的SSD比较早到达他的寿命的上线。
 
川源是目前全球唯一一家我们不需要依靠缓存技术就可以把这个存储的性能做到100万的级别,目前市场上常见的,不管是海外的品牌,或者是国内的品牌,大部分还是需要依靠大量的缓存的技术,您看到的可能是四个或者是八个控制器线性的堆叠,川源核心的技术,100%发挥了SSD应该要有的性能,不利用缓存机制的模式下,就可以把性能做到100万的Iops的级别,未来在2.0的产品,通过集群可扩展式集群的表现,可以把性能做到2000万,甚至是5000万lops的级别。
 
接下来我们提供的是极致的高可靠性,数据在使用的过程当中,除了性能希望很快之外,最重要的一件事情,是数据的可靠度,不能因为追求性能而丧失了数据的可靠度,万一有数据丢失的问题,服务中断的问题,对企业的影响都是非常大的。因为我们自己研发的FlexiRemap技术,可以在发生故障的时候,可以把这个群组锁定成只读模式,避免进一步崩溃,造成数据丢失的问题。传统的RAID技术,因为他们并不具备多层次映射表的设计,当数据保护群组里面发生故障时,还会持续让数据往已经有故障的群组里面写,很容易造成第二块盘,第三块盘进一步故障,导致数据的崩溃。在我们的数据上,把已经不健康的群组先锁定成只读的模式,通过映射表的机制,把这个数据全部引导到健康的群组做一个写入,这样就可以避免已经有故障的群组进一步崩溃,导致数据丢失的问题。
 
同时,提供用户对称式双活高可靠度的设计,因为我们都知道,SSD和机械硬盘有不一样的特性,SSD出厂的时候就有一个寿命上限,这个寿命是取决于他的可擦写的次数。传统的磁盘阵列的设计通常是两个控制器带一个存储池,带一个磁盘柜,但是在全闪存阵列的时代,如果还保有这样的设计,风险不是存在于控制器上,而是存在于磁盘柜上,因为SSD的寿命万一到达了上限,是没办法进行访问的。再加上刚刚所提到的,如果你采用的是RAID技术,可能会有热点盘,热点盘会导致有几块SSD寿命,基本上会在同一个时间到达寿命上限。万一你今天这个存储池里面同时发生了两到三块SSD的故障,其实你的上层的控制器有多少个都没有用。川源看到了SSD的特性,所以我们是真正对称式双活的高可靠度的设计,我们给到客户是两个独立的存储设备,通过我们的高速的接口,来实现实时数据同步,对于用户来讲,不管是存储设备上的控制器故障,或者是单一存储设备上的存储池发生大规模的SSD的失效或者是故障,都不会造成业务访问中断,因为我们还有另外一个设备作为实时的备源,可以提供给你直接的业务的支撑,确保你的业务运行不会有中断的问题。通过这个设计,可靠度可以做到六个九,一整年里面需要防范的故障的风险是低于31秒的。
 
同时在两个设备之间的实时数据同步,我们依靠自己专利的技术设计,在双副本的情况下,依然可以把延时维持在一毫秒以内,中间不需要经过缓存的技术进行数据的同步,确保使用的过程当中,不会因为突然的断电造成数据的丢失。
 
FlexiRemap给客户带来的第三个价值,在于超长存储生命周期,过去大家用磁盘阵列考虑这个设备买回来,大概要用五到七年左右的时间,到了七年左右,五年到七年左右,开始评估我要去更换下一代的产品,如果你用的是传统的RAID技术,搭配现在所谓的SSD闪存新的存储介质,你会发现也许不到五年,你可能就会开始要陆续更换这里面的SSD。因为RAID技术搭配SSD的时候,会造成底层SSD的寿命进一步被缩短。正常来讲,一般各位在企业内部可能用一些数据库的应用,或者是虚拟化的应用,三到四年左右的时间,就会面临SSD里面的固态硬盘进行更换的问题。
 
川源通过自己的专利技术,我们可以去有效地延长SSD的使用寿命。专利技术我们可以通过自动学习数据使用状况优化数据存放位置,这个是为了去符合SSD的特性,如果他在旧有的页面上的数据进行更新的时候,并不是直接像硬盘一样,在同一个位置做擦写的动作,而是找到一个新的位置,把新的数据写入,旧的位置标志成无效的数据。可是这个无效的数据在你进行所谓的垃圾回收,空间释放的过程之前,其实是没办法使用的。什么时候进行垃圾回收呢?各位看到,这个图最左边这一排是Block,这里面大部分的数据都变红的时候,就会自动进行垃圾的回收,或者是另外一个情形,红色和绿色格子交错用满的时候,被迫要去找一个承载红色的Block进行垃圾的回收。川源通过自动学习的机制,把这些最经常被更新的数据集中放在一个Block里面去存放,让我们在SSD执行垃圾回收时所得到的负担是非常小的。各位可以看一下,通过川源的自动学习的机制,我们把经常被更新的数据集中在一起存放的时候,SSD要进行垃圾回收的时候,可以找到Block里面大部分都是无效的数据,只有很少量的有效数据,这样要进行垃圾回收的时候,只需要把很少量的有效数据做一个搬动,其他无效的数据可以直接清掉,这个时候对于SSD来讲,性能就比较不会受到影响,同时寿命也不会受到影响。传统的RAID技术,因为缺少了自动学习的机制,颗粒被用满,被迫要进行垃圾回收时,里面会承载很多绿色有效的数据。这个时候就会让SSD忙碌地搬动这些数据,导致SSD的性能下降。因为你要重复把这些绿色的数据重写一次,就导致了SSD的寿命进一步下降。我们会说传统的RAID技术,搭配SSD的时候,往往会让SSD的寿命缩减40-60%。一般期待用五到七年的SSD,在搭配RAID技术时,可能三年、三年半就会开始陆续更换SSD。但是在川源的设计之下,可以确保SSD生命周期被延长,用户使用我们的技术搭配SSD的时候,可以使用七年到十年的生命周期,可以恢复到过去采购机械硬盘磁盘阵列时所预期的一个设备用七年,甚至更长。
 
下面是我们一个评测的结果,各位可以看一下,这个评测怎么做?我们用相同的平台,用了八块200G的SSD,堆叠出大约是1.6TB的容量。测试的方式是什么?我们每一天把1.6TB的空间写满三次,我们连续测半年,观察SSD耗损的状况,最后再推算出SSD大概可以使用多久。通过这样的测评我们可以发现,第一个,对于SSD来讲,1.6TB的SSD,使用到他的寿命上限为主,可以写入的总数据量是大于4.8PB的,这是搭载我们FlexiRemap技术的时候。如果是传统的RAID技术,总共可写入数据量是小于2.8TB。如果每一天重复去写这个数据,写三次,把1.6TB写满三次,在FlexiRemap技术下,依然可以保证你使用超过4.5年,但是我们都知道,每一天把这个容量,存储设备的容量写满三次,这是非常极端的行为,一般数据库的应用场景,或者是虚拟化的应用场景,或者是容器的应用场景下,其实你的SSD的写入次数可能是不到0.7,不到0.5的。但是在这样极致的场景下,我们都可以用到4.5年,一般的应用场景下,基本上可以保证使用7-10年都没问题。如果是使用RAID5的技术,在这么极致的耗损之外,可能用不到两年,就要进行整批量的更换。
 
另外FlexiRemap提供了丰富的存储功能,提供给企业用户各种不同的应用场景,可以有效地运用它。首先包含了自动精简配置,还有高级的数据的精简功能,闪存现在对于各位来讲,有很多客户还在观望,原因是因为闪存的价格相对来讲是比较高的,相较于一般的磁盘阵列来说,闪存的费用还是比较高。我们在数据库,或者是虚拟化,或者是桌面虚拟化的应用场景里面,通过我们的数据的去重和压缩,或者是深度的去重和压缩的技术,我们是有办法协助用户,去把实际上落盘的数据量做到进一步的精简。在数据库的应用场景里面,最高的能力大概可以做到4:1,一个10TB的数据库,在我的全闪存阵列上只耗损2.5TB的容量。如果在虚拟化或者是桌面虚拟化的场景里面,大概可以做到5:1,甚至是10:1的环节,确保用户在采购全闪存阵列的时候,可以不需要按照实际的需要采购,可以通过压缩和去重的技术,买一个相对容量较小的全闪存阵列,协助你节省成本。
 
另外我们也提供了本地的快照,克隆,或者是备份到外部的存储设备,或者是备份到共有云,或者是通过川源自带的接口,实现远程的复制,确保你的这些数据组能够有多个副本,不至于因为本地IT机房发生故障,或者是发生勒索中毒的问题,导致你的业务停摆。我们都可以通过外部的备份的文件,备份的镜像,把系统还原到没有中毒,没有被黑客入侵前的状态。这些技术我们也是采用最新的设计,执行这些设计的过程当中,不会对于系统的IO造成太大的负载,我们可以确保备份的过程时间是非常短的,对于前端业务场景的影响,不会有太大的问题,
 
同时,我们的产品也支持WMware,OpenStack和K8S的支持,可以是现在虚拟化平台下一站是的管理的机制,通过K8S插件的支持,可以实现现在各位在做容器应用场景开发过程当中,把川源当成一个持久性的存储,协助你们在各种不同的应用场景的开发过程当中,如果有迭代更新的需求时,你可以使用原有的数据来去进行不同版本的测试和实验。
 
接下来跟各位介绍一下川源的全闪存阵列目前在制作也当中的应用场景有哪些,首推的是数据库的应用,因为数据库本身就是大量的细碎的数据的使用,数据库的应用场景里面选择上海川源的有五个理由。一是性能非常好,我们在数据库的应用场景里面可以提供超过250万TPM的性能。第二个是免停机,而且非常高的可靠度,因为我们的对称式双活搭配上层,不管是Oracle的RAC或者是集群架构,都可以实现所谓的近端的数据库双活的方案。第三个是通过数据减量的方式降低你在存储设备上的采购成本。
 
第四是投资报酬与维护成本上,原因是因为川源的全闪存阵列目前在全球的性价比排名非常靠前,我们在整体的运维成本上,也可以协助用户进一步降低,我们可以把SSD寿命延长得非常长,采购川源设备之后,七年甚至十年的时间,都不需要对这个设备进行SSD的更换,可以降低设备维护上投入的硬件成本。第五个特色是操作简单,他的架构也很单纯,我们基本上兼容国内大部分数据库主流的架构,而且你不需要进行任何的调整,只需要单纯把原有的设备升级成川源的全闪存阵列,就可以体验到性能上的提升。
 
这边是评测的数据,左边是采用Oracle的数据库搭配20颗企业级SAS万转硬盘性能表现,大概是在48万次左右,右边是把同样的环境,存储设备升级成川源的全闪存阵列,立刻升级到了240万次左右的TB,每分钟在线数据交易量,这个240万次还不到川源存储性能的极限,我们自己内部实际去评测过,这样的性能只耗用了川源性能的1/10。
 
这个架构就是所谓的服务不中断,我们通过我们的对称式双活,两台设备部署在不同的机柜,或者是在近端机房,不同的机房里面,可以去做到搭配上层的Oracle的RAC服务器,可以做到服务不中断的功能。在这样的设计之下,即便是一个机柜里面突然的断电,或者是链路突然掉线,都不会有数据库停机的问题,因为另外一套机柜里面的设备都还能提供实际运行服务。
 
在制造业里面,其实我们有蛮多客户,他们最后选择MES系统里面的数据库运行在川源的全闪存阵列上,通过我们的性能做到MES生产执行系统里面良率分析效率的提升,数据清洗效率的提升。
 
这个是某一个客户导入之后的效益,以前做良率报表统计,数据库查询的过程当中,耗时比较长一点,通过全闪存阵列做到性能的升级,提升的效率大概有6倍、18倍、90倍的时间,可以大幅缩短生产管理人员做良率分析时耗用的时间。
 
另外跟各位分享一下,我们在苏州地区有一个实际的客户,在MES系统里面做过实测,对比的是蛮知名的海外品牌,品牌的名字我就不透露了,这个客户是苹果的一个供应商,他要做的事情其实很简单,MES系统需要让苹果来做良率的查询,整个测试的方法,把两边的环境搭配一样的客户端做一个对比,各位可以看到,川源这边的产品,能够响应的时间比原有海外知名的品牌全闪存阵列产品来得短很多。像检索的时间,川源只花到差不多2秒以内的时间就可以完全响应出来。
 
另外是丰田汽车,或者是优衣库在越南的生产工厂,也用了川源的产品服务他们的MES系统的工具,也做到一些大数据分析的应用。
 
同时我们也支持虚拟化和云计算的应用,像我们的虚拟化这一块儿,支持了VMware VAAI及Windows ODX插件,这个跟传统的厂商他们支持这两个不一样,我们支持的过程当中协助各位做了一个去重,让我们在克隆虚机的时间可以打幅缩短。有一个知名的大学,通过导入全闪存阵列,原本要花好几个小时才能把虚机做完克隆,现在通过这个技术,可以把时间缩短到几分钟。备份和还原的时间原本也是几个小时,做完之后,缩短到大概20分钟。每分钟在线数据交易量原本只有20几万,通过我们的产品,可以把这个性能提升到130多万。
 
另外在AI人工智能的应用场景里面,像是刚刚所提到的,我们有跟容器做一些对接,我们也跟生态圈的合作伙伴一起合作打造了一个AI-Stack专用的算力云。里面很简单,高性能的计算,人工智能、机器学习的过程当中所需要的高并发的场景,通过川源的全闪存阵列协助做到加速,如果是海量数据的话,采用市场上分布式的解决方案,这些数据以对象存储的方式做一个分配。机器学习的平台,上手之后其实很快,其实不太需要人工智能的开发人员做太多的操作系统的部署,或者是算力框架的部署,只需要在平台上点击他所需要的算力的资源,这个平台就可以快速的把这个资源交付到这些人工智能的开发人员手上,他可以快速地进行不同版本的比较,不同版本的学习,而且可以无缝衔接人工智能和机器学习开发人员他们常用的工具,意味着就不需要重新再去学习这些工具,可以快速享受。
 
通过这些平台,GPU的服务器搭配川源的全闪存阵列产品,再加上环境,我们协助国内头部的人工智能的企业,做到算法训练耗时的缩短,缩短的耗时是30%左右。左边是川源的全闪存阵列,执行他们的框架测试时所需要的耗损的时间,对比他原本使用Lustre高性能计算的集群环境,或者是采用开源CEPH分布式的场景,都可以把时间缩得非常短。
 
他们给到我们的评价,目前是他们实测过所有存储产品里面效果最好的,其实我们在我们的存储设备上,也把他们在业务网所使用的网络环境的带宽上限,测到一个极限。他今天把业务网的网络环境再做一个升级的话,算法训练的耗时还可以进一步缩短。
 
我们都知道工业互联网,数据是至关重要的事情,川源希望通过我们的专利技术,协助各位在建立数据应用平台,应用场景时,可以依靠川源的技术,获得更好的效率的提升,获得更高的可靠度,保障业务持续运行。早上余总提到的数字孪生,或者是自动化的生产,大部分都是需要依靠大量数据的交互作用,甚至自动化生产的过程当中,有一些人工智能的机器学习,要去做到流程的改善,都可以通过川源的产品协助各位做到效率的加分。
 
感谢各位的时间,希望会后如果有需求的话,川源的摊位就在外面,靠近电梯口的地方,欢迎各位到我们的摊位多多交流,谢谢!

关键字:存储

原创文章 企业网D1Net

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^