当前位置:大数据采集存储 → 正文

EMC存储上的大数据–HDFS存储可靠性

责任编辑:editor005 作者:Fenglin Li |来源:企业网D1Net  2015-01-13 13:27:56 本文摘自:EMC中文支持论坛

企业为了从其Hadoop分析投资中获取最大价值,企业需要富有弹性的大数据存储基础架构。在传统Hadoop集群中,用户必须依赖于自定义的子数据块CRC校验和来提供硬件层数据保护,并且在HDFS层使用镜像技术以保持某种级别的数据冗余。但是,在规模较大的情况下,这会成为一个非常高成本的方案。如果通过EMC Isilon作为存储层,Isilon的数据保护是在OneFS文件系统级别实施的,因此要使新的保护和性能方案可用,只需执行OneFS软件升级即可。OneFS使用经过广泛验证的Reed-Solomon擦除编码算法来执行其奇偶校验保护计算。在文件界别应用保护,使得集群可以快速高效地恢复数据。信息节点、目录和其他元数据在于其引用的数据块相同或更高的级别进行保护。由于所有数据、元数据和向前纠错(FEC)数据跨多个节点条带化,因此不需要专用的奇偶校验驱动器。这不仅可以防止出现单点故障和瓶颈,还使文件重建成为一个高度并行化的过程。

OneFS还支持多种混合保护方案。这包括N+2:1和N+3:1,前者可针对两个驱动器故障或者一个节点故障提供保护,后者可针对三个驱动器故障或一个节点故障提供保护。对于高密度节点配置而言,这些保护方案特别有用。万一发生多个设备同时故障的情况,以至于文件“超过了其保护级别”,则OneFS将尽可能重新保护所有可保护的内容,并且将与受影响的个别文件相关的错误报告到Isilon集群的日志。

HDFS1.png

  Isilon还支持多项保证数据可靠性功能,例如:

日志文件系统:每个Isilon节点都配备了一个由双电池支持的NVRAM卡,以保护节点的文件系统。主动节点/设备故障:OneFS将主动删除任何达到特点的已检测ECC错误阀值的驱动器,自动重建该驱动器中的数据并将其定位至该集群中的其他位置。整个过程完全自动化,无需人工干预。Isilon数据完整性:ISI数据完整性(IDI)是一种通过32位CRC校验和防止文件系统结构损坏的OneFS过程。所有Isilon数据块(包括文件和元数据)都利用校验和验证。协议校验和:OneFS为远程数据块管理(RBM)协议数据提供了校验和验证。RBM是Isilon开发的机遇RPC的单播协议,可供在后端集群互连上使用。动态扇区修复:DSR功能可用来隔离损坏的磁盘扇区,重新向完好的数据以便在其他位置重新写入。Mediascan:MediaScan在OneFS中的作用是检查磁盘扇区并部署DSR机制,以便强制磁盘驱动器修复他们可能遇到的任何扇区ECC错误。

总之,在HDFS存储层使用EMC Isilon存储,可以避免多种传统Hadoop存储实施的许多缺点,如下所示:

HDFS2.png

关键字:存储层EMCIsilon

本文摘自:EMC中文支持论坛

x EMC存储上的大数据–HDFS存储可靠性 扫一扫
分享本文到朋友圈
当前位置:大数据采集存储 → 正文

EMC存储上的大数据–HDFS存储可靠性

责任编辑:editor005 作者:Fenglin Li |来源:企业网D1Net  2015-01-13 13:27:56 本文摘自:EMC中文支持论坛

企业为了从其Hadoop分析投资中获取最大价值,企业需要富有弹性的大数据存储基础架构。在传统Hadoop集群中,用户必须依赖于自定义的子数据块CRC校验和来提供硬件层数据保护,并且在HDFS层使用镜像技术以保持某种级别的数据冗余。但是,在规模较大的情况下,这会成为一个非常高成本的方案。如果通过EMC Isilon作为存储层,Isilon的数据保护是在OneFS文件系统级别实施的,因此要使新的保护和性能方案可用,只需执行OneFS软件升级即可。OneFS使用经过广泛验证的Reed-Solomon擦除编码算法来执行其奇偶校验保护计算。在文件界别应用保护,使得集群可以快速高效地恢复数据。信息节点、目录和其他元数据在于其引用的数据块相同或更高的级别进行保护。由于所有数据、元数据和向前纠错(FEC)数据跨多个节点条带化,因此不需要专用的奇偶校验驱动器。这不仅可以防止出现单点故障和瓶颈,还使文件重建成为一个高度并行化的过程。

OneFS还支持多种混合保护方案。这包括N+2:1和N+3:1,前者可针对两个驱动器故障或者一个节点故障提供保护,后者可针对三个驱动器故障或一个节点故障提供保护。对于高密度节点配置而言,这些保护方案特别有用。万一发生多个设备同时故障的情况,以至于文件“超过了其保护级别”,则OneFS将尽可能重新保护所有可保护的内容,并且将与受影响的个别文件相关的错误报告到Isilon集群的日志。

HDFS1.png

  Isilon还支持多项保证数据可靠性功能,例如:

日志文件系统:每个Isilon节点都配备了一个由双电池支持的NVRAM卡,以保护节点的文件系统。主动节点/设备故障:OneFS将主动删除任何达到特点的已检测ECC错误阀值的驱动器,自动重建该驱动器中的数据并将其定位至该集群中的其他位置。整个过程完全自动化,无需人工干预。Isilon数据完整性:ISI数据完整性(IDI)是一种通过32位CRC校验和防止文件系统结构损坏的OneFS过程。所有Isilon数据块(包括文件和元数据)都利用校验和验证。协议校验和:OneFS为远程数据块管理(RBM)协议数据提供了校验和验证。RBM是Isilon开发的机遇RPC的单播协议,可供在后端集群互连上使用。动态扇区修复:DSR功能可用来隔离损坏的磁盘扇区,重新向完好的数据以便在其他位置重新写入。Mediascan:MediaScan在OneFS中的作用是检查磁盘扇区并部署DSR机制,以便强制磁盘驱动器修复他们可能遇到的任何扇区ECC错误。

总之,在HDFS存储层使用EMC Isilon存储,可以避免多种传统Hadoop存储实施的许多缺点,如下所示:

HDFS2.png

关键字:存储层EMCIsilon

本文摘自:EMC中文支持论坛

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^