大家周二好。
DELL首次登顶,可惜文章基本都和存储无关(没有看到DELL针对存储的公众号);华为IT第二,DOIT第三。
上周五,西瓜哥发表了学习DELL双活的学习心得,林肯大叔对西瓜哥的文章给出不同意见,刊登如下:
这里再声明一下,我的学习笔记仅仅代表我的观点,而且我的资料基本都是网上找的,肯定有不对的地方。我相信大家都会像林肯大叔一样,会有自己的观点的。同样的事情,大家的立场不同,看法不同,我想这个很正常。我只是负责引起大家的思考就可以了。不过针对第三站点仲裁机制,西瓜哥心得里还是认为数据中心的双活还是应该部署这个的,因为所有通过VMware vSphere Metro Storage Cluster (vMSC) 认证的存储产品,都有这样一个机制。
今天,西瓜哥从WMware的官网上,把通过vMSC认证的几个存储大厂的双活方案做一个横向的比较,这样大家就应该有一些概念了。
先说一说网关形态的,EMC的VPLEX和IBM的SVC。
EMC VPLEX
我们看到,VPLEX明确采用在第三站点的仲裁机制。Witness可以用一个VM来实现,成本也不高。
VPLEX支持两种组网,一种叫非统一的主机访问。也就是站点A的主机和站点B的VPLEX没有直接的链路,他们只看到本地的存储卷。这种方式组网最简单,无需实现跨站点的Fabric。
另外一种组网方式就是统一的主机访问(交叉连接)。主机的HBA同时连接两边站点的VPLEX存储设备。这个需要实现跨站点的Fabric。
EMC VPLEX测试的场景也是最多的,非常完整。
我们看到,如果仲裁设备出了问题,VPLEX是不做任何处理的。
IBM SVC
IBM SVC也是网关形态的双活。
SVC和VPLEX一样,也支持两种方式的组网。第一种这种组网不需要跨站点的Fabric,如下图:
第二种组网需要跨站点的Fabric,如下图所示:
我们看到,两种组网都需要部署第三站点的仲裁机制。而且,IBM SVC也是唯一一个具有备份仲裁机制的厂商,当活动仲裁磁盘不能访问,备份仲裁磁盘可以接替其工作。
不过,IBM SVC测试的场景好像没有EMC VPLEX多,主要是没有进行场景细分。
IBM SVC发现主仲裁设备不能访问的时候,会把同步暂停,直到备份的仲裁盘激活。
看完网关形态的,我们来看看阵列形态的vMSC认证情况。
HP 3PAR PEER PERSISTENCE
3par peer persitence也是有第三站点仲裁的。
这个是测试的场景,我们看到,当仲裁设备不可访问的时候,3par会停止自动切换。
NETAPP METROCLUSTER
MetroCluster支持两种组网。如果两个站点的距离少于500m,NetApp可以直接把两个FAS控制器分开,一边一个。这种组网方式成本最低,这个也是NetApp与众不同的地方,它的FAS双控是可以分离的。这种组网方式NETAPP叫Stretch MetroCluster。
另外一种方式就和其他厂商一样了,需要跨站点的Fabric。这种组网方式NetApp叫做Fabric MetroCluster。
不过,我们看到,无论采取哪种组网方式,第三站点都需要部署一个MetroCluster TieBreaker(MCTB),这个就是仲裁设备。它可以部署在VM上,作为windows或者UNIX/linux的一个服务进程而存在。
MetroCluster测试的场景很多,我们看到,如果仲裁设备MCTB故障,NetApp处理的方式和VPLEX一样,访问不受影响。
HDS HAM
我们前面介绍过,现在HDS VSP G1000支持GAD,是真正的双活(类似VPLEX)。但其实HDS很早就支持另外一种主备双活(对于同一个LUN而言,不能同时被两个站点访问),这个通过其多路径 软件Hitachi Dynamic Link Manager (HDLM)集成Hitachi High Availability Manager (HAM)管理功能来实现。
除了支持中端存储HUS-VM外:
也支持高端存储VSP。因为HAM采用TureCOPY技术,而HUS-VM采用的也是高端存储的复制技术TrueCOPY。
而且,HDS对第三站点的仲裁要求非常严格,必须采用FC阵列做仲裁。不像其他产品,大部分采用VM就可以了。
从HDS测试的场景看,当仲裁设备不可访问,HDS会停止TrueCOPY的同步,从卷也停止只读(因为这个时候数据不一致了),但主卷可以继续访问,同时自动切换也停止。
大家可以回顾一下我们前面讨论过的HDS VSP G1000 GAD的测试场景:
我们看到,当仲裁设备不能访问的时候,GAD会发生存储的切换,而HAM不需要。主要是GAD是真正的双活,两边都有写访问,因此需要把从设备的I/O切换到主设备上,而HAM本来从设备就没有写访问,因此没有这个问题。
上面都是西瓜哥从VMware Knowledge Base找到通过vMSC认证的双活方案的资料。大家可以看到,所有的解决方案都必须支持第三站点的仲裁,如果没有,应该是不能通过vMSC认证的。因此,我还是认为,第三站点仲裁还是非常重要的机制,特别对于大型的双活数据中心。
还有,普通的主备方式的双活方案(对于同一个LUN而已),可以支持vMSC,但不能支持ORACLE RAC跨站点双活,因为同一个LUN不能两个站点同时写。
通过这几天的学习,西瓜哥发现其实双活数据中心好像很多厂商都支持了,但大家支持的方式不太一样,程度也不同,区别主要体现在下面三点:
1、采用网关形态还是阵列自己实现?这两种方案各有优缺点;
2、是否支持第三站点仲裁?最好能够通过vMSC认证;
3、对于同一个LUN是否两个站点都可写?能否实现跨站点部署ORACLE RAC双活?
除了上面三点,其他的方面从用户角度看区别都不大。
好,今天就分享到这里。如果觉得本文有用,请帮点个ZAN,谢谢。
See you next time.