您当前的位置:首页 > 成功案例 > 电力行业

全方位培训与技术支持 西北电网树IT运维专业化典范

时间:2011-06-10

摘要:
西北电网有限公司信息系统监控中心通过使用北塔BTIM系统作为监控核心,建立起了一套全面的信息系统运行监控预警体系。当某些信息系统出现问题时,监控中心的工作人员将通过告警在第一时间发现问题,并将问题通知相关负责人及时解决。通过这种工作方式使信息系统监控中心真正成为发现公司内部信息系统潜在问题的前哨站。

 关键字:北塔BTIM;IT运维;运维管理;系统监控

行业背景

随着信息技术在电力行业经营管理中的广泛应用,信息安全问题越来越重要。电力系统信息安全问题威胁到电力系统的安全、稳定、优质的运行。经过几年来的信息化安全建设,电力信息技术相关部门都已经建设了完备的基础网络,同时实施了一些信息安全系统,为保障电力部门的信息安全起了很大作用。

项目背景

西北电网有限公司是国家电网公司在西北投资设立的国有独资公司,成立于2003年11月,内设18个职能部门,下设11个直属单位,基于国家电网公司“十一五”信息发展规划明确的重点工作,随着 SG186 工程的深入,业务系统逐渐呈现为:一方面提供信息服务的IT软硬件的品牌繁杂、规模不断庞大;另一方面,IT软硬件的运行情况对企业各项业务的开展影响越来越大,对信息系统安全、运营和维护管理的要求日益提高。

用户需求

2010年底,西北电网有限公司信息系统监控中心建设完成,该中心拥有液晶显示大屏以及一套先进视屏控制系统,西北电网公司计划将使用这个视频监控中心对目前公司的IT环境进行全面监控。
西北电网有限公司在信息化建设过程中遇到一些困难,如:国内运维软件繁多,该选择哪一种运维软件进行监控?监控中心目前配备的工作人员大多不是专业技术人员。如何能在短时间内,将他们培训上手,成为发现信息系统问题的前哨站。
因此,西北电网有限公司亟需建立一套完善、稳定、高效、灵活的信息系统运维管理监控平台,为其信息系统正常运行提供有力支撑。提高信息系统运行效率和服务质量,并对信息系统在运行中的异常作出及时响应,由此来提升信息公司系运维管理水平。

北塔分析

如何能让西北电网公司信息系统监控中心运转起来?如何能让监控中心的人在缺乏专业知识的情况下迅速上手工作?经过与用户的悉心沟通,最终采取监控中心的工作人员以我们系统的告警信息为基础而对各个信息系统进行实时监控的工作方式,并对西北电网有限公司的各种IT资源出现的问题进行及时发现和处理的工作流程。

解决方案——全方位培训与技术支持

根据监控中心的运行目的,即:及时发现问题并通知相关维护人员,以及目前监控中心工作人员的现状,为了能使监控中心尽快投入使用,方案落实为将北塔BTIM系统中的监控总览、广域网和局域网的拓扑图显示在监控中心的大屏幕上。
♦首先,对目前西北电网有限公司的所有IT资源进行统计,并按照规范进行等级划分和命名;
♦其次,按照所处系统的关键性将IT资源划分为三个等级,一级为关键监控点,二级为重要监控点,三级为普通监控点;
♦再次,按关键性等级对所有IT资源进行统一格式命名,如:“一级-XXX主机-管理员姓名”。
♦最后经过与西北电网相关系统管理员进行沟通和讨论,就目前系统中所有监控点的告警规则进行制定。然后按照制定好的规则实施告警,同时对监控中心的用户账号增加语音告警功能。

主动、及时告警

北塔BTIM IT运维解决方案通过设置阈值和定义告警级别,实现对网络设备、数据流量、服务器、网络应用的全面监控,确保整个IT系统从网络到应用的正常运行。通过颜色,语音、E-mail、短信等多种手段,主动告知用户网络中可能存在的故障隐患点,实现“机房无人值守”。
此方案中提供的多种手段和工具,通过事件和数据的关联性及一致性,帮助用户进行故障的定位。用户可以根据故障的类型定义事件处理方式和流程,并可以通过北塔BTIM自动进行故障处理。北塔BTIM还可以与第三方程序连动,在发生告警时可以调用相关的程序进行进一步处理。

物理拓扑图:故障根源透明化

北塔BTIM 系统物理拓扑图上的颜色标识,可以在第一时间初步发现可能的问题和隐患。系统拓扑图中,通过鲜明的红、黄,蓝三种颜色,反映网络中总流量、帧流量、广播流,丢包和错包等情况。信息中心管理人员通过拓扑图上的颜色,能一目了然地发现需要关注的节点,一旦发生了问题,系统通过网络整体状况一览、历史记录、实时数据、信息定位技术等等,可以协助管理人员寻找可能的相关事件,排除干扰,增加判断的条件,为快速定位问题及解决问题,提供强有力的帮助。

全方位IT运维培训

由于监控中心的工作人员都是非专业IT系统管理员,在短时间内将其培训成专业人员难度很大,因此我们对相关工作人员进行了有针对性的专业培训:
培训内容从如何简单操作北塔BTIM  IT运维管理系统、如何登陆,如何查看监控总览界面、发现系统中的告警;到如何查看、统计系统中的实时告警数据,告警内容如何汇总、告警级别分析;在相关操作人员了解告警功能如何有效操作后,再对监控中心工作人员IT运维基本常识、监控中心工作方式进行培训。

一体化监控系统轻松操控

通过与用户对相关运维系统规则制定,对监控中心的运维人员进行相关培训后,西北电网有限公司信息系统监控中心顺利投入了使用,监控中心工作人员通过使用北塔BTIM系统,当出现告警时,我们系统以声音和屏幕显示的方式将告警通知监控中心的工作人员,工作人员打开告警,查看告警项的等级和内容,被标为一级的告警项,工作人员将第一时间通知该监控项的负责人。被标为二级的告警项,监控人员将观察该告警项在一定时间内是否恢复,如果没有恢复将告知该监控项的负责人进行解决。被标为三级的告警,工作人员将只把该问题记录在案,以天位单位向负责人进行汇报。此外监控中心每天还利用我们系统中的告警日志查询和告警事件统计报表,对每天的告警进行统计,将统计后的数据交给信息维护部门用来分析各个信息系统中的潜在问题。

实施效果

西北电网有限公司信息系统监控中心通过使用北塔BTIM系统作为监控核心,建立起了一套全面的信息系统运行监控预警体系。当某些信息系统出现问题时,监控中心的工作人员将通过告警在第一时间发现问题,并将问题通知相关负责人及时解决。通过这种工作方式使信息系统监控中心真正成为发现公司内部信息系统潜在问题的前哨站。

通过系统强大的预警机制,使得监控中心的工作人员能够在第一时间对公司各个信息系统中已经出现的问题的进行及时的响应,并安排相关人员对问题进行解决,提高西北电网有限公司信息维护部门的运维效率,使潜在问题得到及时发现和处理,有效提高西北电网有限公司相关信息维护部门的服务质量。

 

相关文章

产品中心
北塔BTSO 智慧运维平台
新一代运维管理软件,智能化、自动化成就智慧运维..
北塔BTDO业务保障系统
从网际数据流量角度分析业务、保障业务、守护业务...
EMonitor监控管家
轻量级自动监控管家,服务中小企事业单位...
解决方案