一个数据中心运维人员的自述

责任编辑:wendy

作者:harbor

2013-10-28 16:59:49

来源:企业网D1Net

原创

五年前,我即将大四毕业,偶然的机会应聘进了某国有银行,并在该银行一个全国性的数据中心工作,负责这个数据中心的运维工作。从刚开始对数据中心一知半解,到现在成为业务骨干,短短几年的历练,让我对数据中心的运维工作颇为精通。

企业网D1Net -北京  10月28日  五年前,我即将大四毕业,偶然的机会应聘进了某国有银行,并在该银行一个全国性的数据中心工作,负责这个数据中心的运维工作。从刚开始对数据中心一知半解,到现在成为业务骨干,短短几年的历练,让我对数据中心的运维工作颇为精通。这期间有过迷茫的思绪、有过离开的想法、也有解决工作上问题后的成就感。对于更多的人,数据中心里究竟如何展开工作的,有哪些内容并不了解。让我来简单说说这里的门道,以便对那些即将进入这个领域的人或者仍处于工作迷茫中的工程师们有所借鉴和启示。

数据中心是一个公司、企业或政府部门的信息处理中心,几乎所有的业务都要经由数据中心才能完成,所以数据中心对于一个企业或政府部门至关重要。一旦数据中心出现故障,那所造成的损失是非常严重的。比如:铁道部的12306网站曾出故障,造成了全国范围内无法进行网络订票;腾讯的微信故障,造成千万用户无法访问;还有淘宝故障,这让上万的商户没有收到,大量用户无法进行网络购物;还有银行、航空、铁路、企业等等,只要数据中心故障都会给业务带来重要损失。

作为一个数据中心的运维人员,其工作的主要职责就是保证数据中心的稳定运行,不出故障;其次,运维人员还要跟踪数据中心领域的新技术,提升数据中心的运营效率;再有,在数据中心部署新的应用业务,以便满足发展需要。一般一个数据中心会分为:基础网络、存储、服务器、应用系统等多个技术团队来支撑。如果数据中心的规模比较小,就要求运维人员是一个多面手,需要掌握方方面面的技能。我所在的国有银行,数据中心遍布全国,各地都有数据中心的机房,承载着不同的业务。有:存储业务、电话业务、外汇业务、灾备等等。这样大规模的数据中心,运维也细分了多个运维团队,每个运维团队负责数据中心某一块技术的运维工作,我进入了数据中心网络的运维团队。银行的数据中心早已实现了全国的联网,我们团队的人员要在全国各地处理各种各样的问题,负责全国各地数据中心网络设备的维护工作。鉴于数据中心的重要性,我们银行也购买了驻场的服务,网络、服务器、存储等关键设备厂家都有派工作人员常驻在我们银行,与我们共同工作。

数据中心运维工作最辛苦的莫过于要经常熬夜,因为数据中心包含的设备众多,IT设备往往使用年限也就5年,需要不断地更换硬件和升级软件,而且银行业务也在经常变化,网络要做变更,所以这些操作都需要在业务最少的时候进行,凌晨2~5点是最佳的操作时间点,这样熬夜就成了家常便饭。有些数据中心要求有人24小时值守(一般是电信、联通等大型数据中心机房),这些人要更为辛苦。有时夜间变更进行的不顺利,为了尽快恢复正常的业务,就需要一直工作,直到系统恢复正常为止,往往连续20~30个小时都得不到休息。

由于数据中心建设的前期规划比较好,系统整体运行还是比较稳定的,所以在平时的工作中,更多的时间是在学习、交流,不断提升自身的技术水平。一旦数据中心监控出现异常,就要立即停止手上所有的工作,进入到异常检查中来,尽快修改异常,使数据中心恢复到正常中来。数据中心是为银行业务服务的,所以银行业务发展的越快,数据中心运维人员就会工作越忙,要不断地满足业务部门的需求。在白天讨论方案,在晚上实施。在这里,一些厂商的驻场工程师启到了作用,也会给业务部署的实施给出一些指导性意见。一旦无法满足,尽量去找到解决的方案。作为银行的运维人员主要关注点还是在业务的应用部署上,涉及到设备的配置更改,网络变更操作等都需要设备厂家的驻场工程师来完成,我们进行监控和督导。在其它的一些小型数据中心,恐怕就没有这么幸福了,一些设备的变更都需要自己去修改,根本找不到设备厂家的技术支援,工作量就要大很多。设备厂家的人就在银行的数据中心和我们一同工作,这也让我们对设备的操作能很快上手。

作为数据中心的运维人员,最担心的就是数据中心出问题,并且影响到应用业务,这个有时会影响到个人的工资和奖金。因此,稳定就是一切。如果新加业务可能会对现有业务构成风险,那么就尽量不去做。实在不行,就建一套实验网,测试验证没有问题后再在现网实施。所以在数据中心,即使我们这些运维人员,也不能直接对网络设备进行任何的调整与更改,待向上级领导和业务部门同意后才能实施。

作为数据中心的运维人员,也有过迷茫,从技术上来讲,没有设备厂商的人员掌握精通,从银行内部来讲,数据中心运维人员是属于花钱的部门,而不是创造利润的部门。因此,曾有退却离开的想法。之所以能坚持下来,就是和主管沟通时发现了一些闪光点。比如对数据中心整体网络的把握,系统性的问题理解,这些往往是其他人所无法能及的。还有对银行行业数据中心网络未来的发展,银行业务的实施部署,这些都需要专业的人士才行,而我恰属于此。数据中心已经成了银行提升利润率的部门,对于银行至关重要,这也让我对工作有了重新的认识,我也在数据中心运维这个岗位上找到了实现自我价值的地方。

行行出状元,作为过来人,对于那些有可能步入数据中心运维行列的工程师们,希望你们能不断地提升自身技能,跟踪数据中心新技术的发展,为数据中心运维工作添砖加瓦。一旦迈入这个行业,还是需要平和的心态,勇于专研,做好本职工作。现在数据中心越来越火,相信数据中心运维工作也会更加有挑战、更优吸引力。

链接已复制,快去分享吧

企业网版权所有©2010-2025 京ICP备09108050号-6京公网安备 11010502049343号