您当前的位置:首页 > 成功案例 > 电力行业

西南电力设计院网络管理的经验与成果

时间:2010-08-23

摘要:
网络就像一个黑盒子,通常只有故障发生后,运维人员才能知晓网络的非健康状态。因此,运维人员就成为了企业IT问题的“救火队员”,处于忙碌而无序的工作状态之中。西南电力设计院在以往的网络管理工作中也遇到了同样的问题,在各级领导的大力支持下,IT部门引进了北塔网络管理系统以后,才实现了高效、便捷、有序的IT运维管理。


 关键字:BTNM,北塔软件,网络运维管理

 网络就像一个黑盒子,通常只有故障发生后,运维人员才能知晓网络的非健康状态。因此,运维人员就成为了企业IT问题的“救火队员”,处于忙碌而无序的工作状态之中。西南电力设计院在以往的网络管理工作中也遇到了同样的问题,在各级领导的大力支持下,IT部门引进了北塔网络管理系统以后,才实现了高效、便捷、有序的IT运维管理。

传统人工管理的弊端

2005年左右,我院原有的老网络系统已经全部升级改造完成,目前全院以千兆光纤做主干,百兆电口到桌面,目前有百余台思科二层、三层网络交换机以及其他的网络设备和服务器。

IT部门运维的工作量大而杂,传统手工式管理效率低下,存在如下问题:

一、网络设备分布广泛,运维人员无法掌握全部网络设备的运行情况,当网络发生故障时也无法及时、准确的定位故障根源,经常是出了事情四处救火;

二、大量的思科网络交换机多采用原始的、分散的、单台的管理方式,给日常工作和运维管理带来了很大的困扰;

三、被动救火式的管理方式让运维人员承受着巨大的业务压力,工作很辛苦但收效却不显著。

从2005年开始,我院在完成网络升级改造工作后,就开始引进和使用北塔BTNM网管平台,以自动化、智能化的管理方式替代了以前人工管理的方式。目前,该系统已经成功应用于我院计算机网络近5年,极大提高了日常IT运维管理效率,把运维人员从“救火队员”的角色中解放了出来。

网络管理平台的作用

我院目前拥有百余个网络交换机节点,绝大部分为思科的交换机设备。北塔网管软件的基础模块主要包括网络、设备、资源、告警等管理。可有效解决以下问题:1、拓扑集中、直观展现了全网所有思科交换机节点,能够清楚掌握所有思科交换机设备和网络各个链路的实时状态;2、同时可以更进一步的查看这些交换机设备的CPU、内存等实时信息,对于异常的设备,管理人员可以直接通过北塔独有的、真实、直观的设备面版图进行远程操作,远程关闭相应端口来达到保障全院整个网络系统正常运行的目的。

各个思科交换机节点都能在拓扑图上集中动态展现,节点之间的连线代表的是真实的网络线路连接关系(堆叠或者级联),表明了各个思科交换机设备之间的逻辑关系与物理关系。节点和线路的颜色有红、黄、绿三种,代表着对应的状态为紧急、提醒、良好。运维人员无需跑到各个设备实际安放的位置去查看设备,只要看一眼拓扑图就心中有数了。全院百余台思科交换机设备在这里能够进行集中、统一的远程管理。

北塔网管平台实现了对于我院交换机系统的主动管理,能够事先发现可能存在的隐患,提高了我院运维人员的工作效率。

精确IP定位,规范管理终端接入设备

在日常的运维工作中,由于PC终端众多,IP准确定位是令人非常头疼的一个问题。我们前期测试过一些厂家的网络管理产品(包括硬件的和软件的),这些产品由于不能生成立体的全网拓扑图,因此根本不能进行IP定位;如果依靠IT人员人工来依次进入每台交换机进行搜索,则会出现大海捞针的尴尬局面;北塔网管平台轻松解决了这个问题。

在我院网络日常运行维护的过程中,我们遇到过数次终端用户私自将私人的路由器直接接入院网,造成部分PC终端IP地址分配错误,从而出现这部分PC不能上网的情况。以前没有北塔网管平台的时候,运维人员只能逐条线路的进行排查,费时又费力,而且效率十分低下;现在有了北塔网管平台,运维人员就可以在百余台交换机设备中快速、精确定位出该路由器所在的位置,并且可以触发后续的处理措施,比如直接关闭该路由器所在的端口等等,完成以前不敢想象的繁琐的工作。

另外以下一些情况:1、如果有PC终端非法占用了服务器的IP地址,造成服务器不能正常的工作;2、利用内网IM工具向全网乱发消息;3、进行病毒传播、攻击等异常行为;有了北塔网管平台后也可以及时定位并关闭该PC终端所在的端口,从而保护我院整个内网系统的安全。

主动发现网络异常,防患于未然

网络就像一个黑盒子,肉眼无法看见网络里面的数据传输。就像再好的医生也要借助医疗仪器,通过医疗仪器的扫描分析报告来做病情诊断。对于IT运维人员而言,北塔网管平台就是一个分析仪器。目前随着网络应用和规模的不断发展,ARP、蠕虫、DDOS攻击等网络病毒与攻击也频繁出现,严重的情况下会造成网络的部分中断甚至全部瘫痪。但是,现有的防火墙、杀毒软件等安全防护措施并不能100%的预防,而且通常是在故障发生后才去查找原因,解决问题,此时已经造成了损失。因此,打造稳固健康的网络,我们需要把握主动权,尽可能的防患于未然。北塔的数据流功能,可以对所有网络中的异常流量进行根源查询。通过对每个协议包进行分析,所有出入的协议数据包都可以全部展现,有任何的异常流量管理员都可以及时发现,及时处理,并且可以对所有网内的计算机进行IP+MAC+交换机端口的绑定,发现某台计算机有异常行为时,可直接定位到这台计算机所连接的交换机端口,可自动或手动关闭此端口以保证整体网络的正常运行,及时将安全隐患消灭在萌芽状态。

丰富翔实的报表成为IT决策依据

衡量网络运维管理水平的标准有很多,可以从员工的投诉数量来反馈,也可以从业务部门的运行效率来体现,甚至可以从领导对于企业整体的信息化进程来观察。但归根结底下来,领导需要的还是能够落到实处的衡量标准,这就是强大的报表。网管软件提供的报表是管理和决策的重要依据,具体从下面几个方面谈起:

1)      各部门的运维状态是否正常高效?绩效是否达到了预期?

2)      企业网络带宽利用率如何?是否需要进行扩容?

3)      网络系统中哪些设备的负载长期过高,成为系统瓶颈,需要进行更换?

4)      哪些安全事件比较突出,影响到企业内网的安全运行,如何采取优化策略?

以上的问题摆在任何一个IT领导面前,都会是棘手的问题,但在报表功能的帮助下,这些问题都将轻松地迎刃而解。简单来说,报表所起到的作用可以概括为八个字“统计分析、安全评估”。这对于信息化建设来说有着极其重要的意义,只有统计分析才能得出信息化系统处于怎样的运行状态,通过网络瓶颈分析才能找出网络架构中不合理之处,进而采取相应的解决方案以规避可能的安全事件,提高内网的安全等级。

 北塔通过预制报表和定制报表,IT管理人员能够掌控网络系统运行的详细状况,并且为运维考核提供数据标准。这些报表的价值是全面而多样化的,简单来说,报表可以从业务影响度、管理方向、管理效率来影响IT系统,引导IT管理更加智能化、系统化,从而成为信息化建设水平的重要衡量标杆。

通过线路流量报表和故障运行率报表,能够为IT运维人员指明管理方向,了解需要进行调整的线路,或者增加带宽以确保充足的流量用于业务运行等。明确了运维管理的改进方向,方能不断提升IT系统运行效率,从而将IT投资的价值最大化。

精确告警省时省力

网络运维管理要主动预防安全隐患,告警就不可或缺。一般网管软件都具备告警功能,但却未必实现精确告警,误报、漏报的话,同样耗费人力。每天接受大量告警信息,运维人员也会淹没在告警海洋之中,疲惫不堪。北塔执行IT日常运维,注重事前管理,强化故障管理与故障预警,通过告警管理降低了IT管理人员的管理被动性,将管理人员从网管机器面前解放出来,真正实现无人值守式的网络运维管理。

北塔通过实时监视整个网络应用,可以不断获取设备各类指标参数,在问题发生前及时了解非正常情况,分析非法入侵、攻击、病毒、物理故障等现象。通过设置阈值和定义告警级别,北塔可以实现对网络设备、配置管理、数据流量、主机、数据库、中间件、网络应用的全面监控,确保整个IT系统从网络到应用的正常运行。

北塔通过颜色,语音、E-mail、短信等多种手段,主动告知用户网络中可能存在的故障隐患点,实现无人值守。用户可以自行为不同告警事件设定相应的告警方式。北塔同时支持以WebService标准接口方式将告警信息传递给第三方接收。

结束语

传统的人工式网络管理已经不适应时代与技术的发展,智能化的网络管理已经是大势所趋。北塔网管平台在我院已经成功应用了近5年,每天全面自动化监控全院网络。应用北塔网管平台之后,我院的IT运维人员深切体会到了诸多变化,最明显的就是工作效率的很大提高,其次是各项工作变得有序且规范。当然,网管工具只是手段,最重要的是网络管理的思路与方式必须转变,以先进的管理思想统筹具体的工作,才能做到与时俱进,高效快捷。

企业信息化建设是“一把手工程”,而计算机网络及其管理是企业信息化的基础。在各级领导的正确领导和大力支持下,经过相关部门的配合和努力,我院的信息化工作取得了实实在在的成绩。信息化工作是提升全院核心竞争力的重要手段之一,因此,IT部门将继续抓好网络管理和信息安全的工作,不断完善和推进全院的信息化应用,以满足全院生产、经营、管理的需要。

   【相关阅读】
    ◆ 北塔BTNM产品概述及系统架构
    ◆ 北塔BTNM产品应用实例
    ◆ 北塔BTNM产品试用申请

相关文章

产品中心
北塔BTSO 智慧运维平台
新一代运维管理软件,智能化、自动化成就智慧运维..
北塔BTDO业务保障系统
从网际数据流量角度分析业务、保障业务、守护业务...
EMonitor监控管家
轻量级自动监控管家,服务中小企事业单位...
解决方案