基于中小企业IT运维管理思路研究
2014-11-12钱军刁志坚
钱军 刁志坚
摘 要:随着国家中小企业信息化产业建设不断的飞速发展,随之带来的就是中小企业用户信息化建设的发展,用户的网络规模日益增长,网络结构日益复杂。因此,IT运维对于用户尤为重要。到了今天,单一的网络管理维护已经无法满足用户对于信息化稳定性的需要,整体的IT运维已经取代了过去单一的网络维护,网管员的工作已经升级到了IT管理者的层次。
关键词:信息化建;中小企业;网络管理;IT运维
1 企业运维的主要难题
1.1 IDC服务商的选择
服务器增多,就要找好的IDC运营商;不然会出现服务器装错、域名白名单取消、机柜的带宽流量无法实时监控、CDN效果不佳等问题。
1.2 服务器提供商和型号的选择
例如出现DELL R410固件问题,每当服务器高流量的时候,服务器网卡会自动断流,需要手动重启网卡,到最后也未能完全解决;之前还遇到过内存,主板故障等问题,服务器的硬件一旦出现问题,就意味着停机检修,服务自然要中断。所以在服务器的选择上也要慎重,而不是只考虑价格问题。
1.3 负载均衡和故障转移
流量大了,或者业务重要性高,就要求最大可能提供服务器的高可用性和数据容灾,自然要部署负载均衡和故障转移;是采用硬件F5,cisco还是软件lvs,keepalvie,heartbeat,nginx方式实现,效果如何?都需要去考量。
1.4 运维团队和人才的培养
对于中小企业来讲,IT运维人才的流失是比较可惜的,如何去留住一批优秀的运维人才也是企业需要考虑的问题。其实不只运维,企业要想有长远的发展都应当想方设法留住人才,控制公司的人员流失率,要让员工有归属感和荣誉感,而不是只有赤裸裸的雇佣关系;企业应该着重培养一支高素质,高凝聚力的运维团队,而不是只当运维是业务部门和程序部门间的夹心饼,里外不是人,这样的环境和团队是留不住人才的。
2 企业运维人员的工作职责
2.1 保证服务器上正常的运行
怎么样才能算正常的运行呢?论坛卡,服务器慢,网站打不开之类的问题,出问题的有可能是服务器,也可能是用户端或者就是中间的网络传输问题,在中国最典型的就是南北互通的问题,因为这种问题很难判断,所以一般管理者会要求运维每年的故障时间不能超过一定的值,说7*24*365服务不间断运行,但是总会有各种各样的问题,无论你用了什么负载均衡,故障转移技术,服务临时中断也是避免不了的,运维的价值在于在缩短服务中断后的MTTR时间,可见运维的压力是很大的。
2.2 备份关键数据,及时处理各种故障,保证服务器安全
备份是为了恢复,一般想到或者用到备份的时候,都是出现麻烦的时候,所以平常工作中对备份一定要足够的重视,尤其是数据库,在某些时候,看起来多年前的备份可能会给你的恢复工作带来意想不到的作用;服务器的安全部分又是复杂的概念,因为安全本身就是相对的,而且安全和性能,用户体验之间是成反比的,运维在很多时候都是牺牲安全来换取性能和更好的用户体验,等将来安全上出现问题的时候再调整。
2.3 及时调整服务器各项设定满足业务需要
框架定了,服务器选了,一般是不会轻易改动的,但设置服务器的工作却是每天都有的。程序有时需要部署个memcache,有时需要个中文分词系统,有时需要加个虚拟主机。运维人员在做这类工作的时候不能像应付任务那样,但求过关即可,否则日积月累下来,服务器会出现意想不到的情况。在处理这类工作上运维人员应当做到规范和文档记录,长期做下来,不但自己的运维专业水平会提高,对于后期的维护也会起到良性循环作用。
2.4 记录服务器维护日志和技术文档
这点都是在处理完问题后记录下,方便加快日后处理同类问题的速度和效率;至于技术文档,身为运维人员一定要认真编写,写的很糟糕的文档会给人误导作用,internet上这类文章不在少数,本身IT这个行业就是很浮躁的,如果不能静下心来好好整理知识,总有一天会被淘汰的;对于过去整理的文档要定期的去温习,有错的要及时更正。
3 企业运维工具的选择
随着企业的业务对IT的依赖越来越多,企业的服务器的架构规模不断扩展,为了更有效率的执行任务,为了我们运维人员不再像流水线上的一名工人一样不断重复的做着同样的工作,我们将会用一类工具,这类工具是可编程的,我们只是需要写上一些代码就可以帮我们自动完成所有的工作。很公司用的是瑞宁CAM,集中审计管控系统,除了能完成自动化运维的工作,比如系统安装、系统升级、批量修改密码、主机名规范、终端资源监控、批量配置管理、终端批量实时操控等等,还有事后审计回放的功能,对于事后总结自己的工作,查找错误点非常有帮助。此外常见的运维工具还有:ickstart、Chef、Nagios、Cobbler、ControlTier、OpenNMS、OpenQRM、Func、Zabbix、Spacewalk、Puppet、Cacti等。
[参考文献]
[1]付资亮.K公司IT运维管理研究[D].华南理工大学.2011年.
[2]王艳君.浅析IT运维的现状与对策[J].中小企业管理与科技(下旬刊).2011年03期.
[3]唐琳,李伟.基于用户体验的“主动式”信息运维管理实践[J].电力信息化.2013年03期.
[4]丁云成,王必荣,孙静.基于ITIL的IT服务管理系统的应用[J].电脑知识与技术.2008年07期.