敏捷的容灾整合:中国西电集团信息系统备份容灾整合记

责任编辑:editor012

2013-10-16 22:17:58

摘自:CNW.com.cn

中国西电集团的整体信息化分为两大系统进行规划与建设,即:集团管控信息系统和子企业生产运营系统,用以支撑集团管控与子企业生产运营业务。由于此前的数据恢复测试失败,以及一次供电问题导致的数据中心宕机,中国西电集团加快了容灾系统的上线进程,并且建立了完备的数据容灾备份制度。

中国西电集团公司(以下简称“中国西电集团”)成立于1959年7月,是以我国“一五”计划期间156项重点建设工程中的5个项目为基础发展形成的以科研院所和骨干企业群为核心,集科研、开发、制造、贸易、金融为一体的大型企业集团。目前,中国西电集团共拥有70余家各级子企业,职工逾两万人。

随着信息化建设的浪潮席卷而来,以及集团业务规模的扩大,中国西电集团于2007年开始进行全面的信息化规划与建设,彻底整合传统模式下各个子公司各自为战而诞生的一个个信息孤岛。信息化管理部负责集团整体信息化建设规划以及总部的集团管控信息系统建设。中国西电集团的整体信息化分为两大系统进行规划与建设,即:集团管控信息系统和子企业生产运营系统,用以支撑集团管控与子企业生产运营业务。

大平台集中管控消除信息孤岛

中国西电集团信息化管理部副主任赵红武与笔者分享了集团信息化建设的经验,并重点介绍了集团信息系统的容灾解决方案。“管理信息化、数字化制造、智能化技术是西电集团信息化建设的三大支撑,有了这三大支撑系统,才可以支撑整个集团公司真正做到世界一流的输变电集团企业”,赵红武讲道。

据介绍,集团管控信息系统规划了财务、人力资源、营销、集团审计、综合统计与主数据管理系统,子企业也有一套生产运营信息系统,可以分为ERP(支持管理)、PDM(支持研发设计)、MES(支持制造过程管理)以及其他辅助的系统,子企业信息系统可与集团管控信息系统实现纵向的集成,这一纵一横的集成的基础便是企业ESB(企业数据总线)。赵红武强调:“我们的信息技术不但要融入到管理中,而且要融入到数字化制造过程中,最关键的是我们的信息技术要能够融入到企业的产品中销售出去,增加产品的附加值,使我们的产品完全具有数字化、智能化的特点。”

在管理信息化方面,由于子企业的信息系统都要接入到集团的系统平台中进行信息共享与存储备份,因此对于集团系统平台的业务连续性需求就会非常高。据了解,源于一次数据备份的恢复测试失败,中国西电集团加快了容灾系统建设步伐,于2009年正式开始规划实施容灾系统。关于容灾系统的规划,西电集团需要的是一个成套的解决方案,而不是一个软件或硬件,容灾系统不仅要能够帮助集团实现整体容灾解决方案,而且应兼具扩展性。系统的整体规划和实施也是按部就班进行,首先对集团管控信息系统进行容灾建设,其次随着集团和子企业信息化建设的推进,再将各个子企业接入到容灾系统中。

四维容灾满足可靠、快速的数据备份恢复

赵红武讲道:“容灾系统实施时考虑了几种我个人认为比较完善的容灾方式:第一,我们有传统的数据备份包括完整备份与增量备份;第二,我们采用存储快照备份的方式,增大了系统备份窗口,在不影响业务系统运行的情况下实现了信息系统的高效备份与恢复;第三就是CDR连续数据复制,我们采用了数据库和应用系统的连续数据复制技术,及时将数据库的归档日志复制到我们的容灾机房,并在容灾机房的服务器上做了定时回滚的操作。在系统实施时,系统维护人员与容灾系统服务提供商CommVault的工程师根据数据库访问情况、应用系统的补丁修改情况制定了科学的备份与同步策略,数据库每半小时同步一次,这个策略完全满足我们的需求。第四就是物理带库的备份方式,把备份的数据复制一份到磁带,磁带出库后可以进行异地归档。”

中国西电集团在容灾机房中配置了虚拟化服务器,为各个应用系统提供应用级容灾服务器,CDR会把生产系统的应用复制到容灾系统,当集团数据中心出现灾难性事故时,容灾系统可以在一小时左右启动,接管数据中心的应用服务,保障了核心业务的连续性。目前集团管控信息系统已经通过传统LAN备份、快照备份、CDR以及物理带库四种方式全面接入容灾系统。

对于数据恢复成功率,赵红武提出了自己的要求:“要保证在硬件和网络没有故障的情况下能够百分之百成功恢复全部数据。在服务器、网络都正常,存储空间足够的情况下,就要求系统能正常备份及恢复。其实备份恢复失败的原因经常出现在存储空间满、服务器宕机、网络故障等方面。我们之前采用的一款软件就出现了备份之后恢复失败的情况,并不是所有的企业都会象我们对数据灾备如此重视,也就不会定期进行恢复测试,如果在需要的时候恢复失败了,造成的后果将无法想象。这也是促使我们更换系统的一个重要原因。”

有的放矢的存储网络部署

赵红武继续介绍道:“各子企业信息化项目必须在集团公司正式立项后才能实施,子企业ERP、PDM、MES等重要的信息系统在建设之初就要规划接入容灾系统。随着系统的上线运行容灾备份也应同步运行。”

在中国西电集团容灾项目选型中,能否支持多组织架构也是重要因素之一。根据中国西电集团的情况,集团下属有数十家子企业,但是不能每家企业都采用一套独立的容灾系统,必须对容灾系统进行整体规划,每个子企业在系统上创建相对独立的备份域,自行维护和管理。不仅在规划存储、服务器等资源时要考虑到扩展性,网络上也是如此,集团数据中心与灾备中心由4Gbps带宽的SAN网络和1Gbps带宽的数据网络连接的原因就是要考虑到未来子企业的容灾接入需求。

本地企业可以通过集团的千兆裸光纤互联,自然在容灾备份方面不存在问题。但是在外地的子企业就会遇到跨地域网络互联的问题,网速和信息安全都是要考虑的问题。中国西电集团通过VPN隧道,将子企业接入集团数据中心与容灾中心来保障信息安全,并为子企业制定了晚八点到早上八点的非工作时间进行备份的策略。

据介绍,中国西电集团目前运行一套存有2T数据的大型OA系统,OA系统有很多制度类的数据,虽然是多年前的,但是仍然会被频繁检索。赵红武讲道:“有时候员工还会在OA系统中根据关键词检索几年前做过的一件事。系统采取两种模式进行检索:第一种是从数据库检索,当检索到之后,系统会根据数据库中的索引在文件系统中读取需要的附件。第二种就是与CommVault共同测试的OA归档。由于时间很长,文件可能被归档到容灾系统中了,如果有人需要访问这类数据,数据就会自动从容灾系统中取到生产系统。实际结果就是文件名还在,但实际上是一个很小的索引,链接到容灾系统中的存储位置,双击之后,该系统会自动从容灾中心把文件取到业务系统,用户只需双击就可打开,整个过程对用户是透明的,而且基于高速光纤网络互联,并不会感到明显延迟。当然,第二个人再访问时就直接在本地打开,而不需再次访问容灾系统了。”

容灾系统的理想与现实

赵红武还说出了大多数运维人员的心声,那就是:“在一切正常的情况下,领导不会特别重视容灾项目,只有信息系统发生过严重事故,领导才会真正重视容灾项目建设。”从访谈中了解到,虽然发生过一次数据中心供电故障,导致服务器大面积宕机,但是由于容灾系统的可靠保护,并且抢修及时,并没有造成数据丢失的严重后果。

由于此前的数据恢复测试失败,以及一次供电问题导致的数据中心宕机,中国西电集团加快了容灾系统的上线进程,并且建立了完备的数据容灾备份制度。赵红武介绍:“制度要求系统管理员定期进行数据的恢复演练和容灾演练。在节假日,管理员就会把业务系统停掉,然后切到容灾系统进行试用,如果没有问题,就再切回业务系统。进行整套的切换、回切和数据恢复演练。”

赵红武最后还强调:“我们倡导简单IT的理念,就要越简单越好。现在我们的IT系统搞得太复杂了,包括大家所探讨的一些概念也过于复杂,IT要简化再简化。包括我们在招标容灾软件时,也有其他厂商的软件系统,功能和效果都不错,但是操作太复杂了。所以我们选择CommVault的系统在很大程度上也是因为它的简洁性。因为一旦系统复杂就容易出错,容灾系统不像邮件或OA系统的使用那么频繁,容灾系统上线后,系统维护人员不用每天进行复杂操作,只是定期登录检查日志,在正常的情况下不需要进行维护操作。所以如果整个过程太复杂,时间长了就会记不清,等发现问题想恢复时,要进行第一步、第二步、第三步等许多操作,操作复杂得具体怎么做都想不起来了,并且很容易出错,这是是企业信息化管理人员无法接受的。”

链接已复制,快去分享吧

企业网版权所有©2010-2025 京ICP备09108050号-6京公网安备 11010502049343号