大型数据中心的运维管理平台如何建立
时间:2013-09-26
很多数据中心管理人员开始筹划或者进行数据中心升级计划,对于这些数据中心的建设,建设者和管理者往往将目光聚焦在其“绿色标签”上,从照明、制冷的节能,到IT基础设施的功耗,都会被上上下下扫描一番。在这种形势下,“高大全”的数据中心建成了。如果说数据中心的正式运营标志了启动了其生命起点,而对于其生命周期中的系统维护,则将伴随着数据中心度过漫长的数十年。
在一些数据中心管理者的眼中,数据中心IT运维并不是新鲜事儿,无论是自建维护团队还是外包第三方服务,都是必需必要的。然而,他们忽视了非常重要的一点——在后信息时代下,传统的IT服务模式,还能继续下去吗?
后信息时代的一个重要特点是数据的大批量集聚,表现为数据来源各式各样、数据规模飞速增长、数据结构纷繁复杂、数据处理手段百出,数据应用面面俱到。海量数据的爆发式增长,需要有足以支撑的IT硬件和软件系统。而对于这些无论从规模还是从功能上都大幅升级的IT系统,如果还坚持传统的“走读式”IT服务,将会遭遇巨大的挑战。
传统IT运维通常采用日常巡检与故障排除的组合式服务,需要IT服务人员要有较高的耐心和细心。对于有数十台IT设备的中小规模数据中心,这样的服务方式足以满足要求。但是,当数据中心的规模以数千台甚至上万台IT设备来计时,这种“手工作业”的模式则会被淘汰,取而代之的是“自动化”模式的IT管理服务。
专家认为,要支撑大型数据中心的可靠运维,必须依赖一个统一的运维管理平台。它应该具备这样的功能:
一、 覆盖数据中心全部IT设备,即将所有设备统一在一个平台上进行管理。
二、 该平台能够实时监控管理对象,使IT人员的管理触角可同时延伸至所有设备。
三、 能够预警,即通过阈值的正确设定,确定预警门槛,既能够“防患于未然”,又不会“虚惊一场”。
四、 能够自动数据分析,具有报表的自动生成功能,使管理运维工作及时、真实地反应出来。
具备了以上性能的运维管理平台,应该说只是具有的基本的功能框架,还需要大量的细节来加以丰富。例如:对于该平台的访问模式,是采用单一模式还是多样模式?是否接受远程访问?告警内容以何种方式发送给对应人员,语音、短信,抑或电子邮件?如何在自定义周期内进行自动触发,从而完成IT运维的例行巡检,并生产巡检报告?如何联动分析告警信息,从而判断单点告警事件的影响面有多大?如何进行风险评估,并提前解决风险点?
以上种种,看似琐碎,实则需要运维管理平台的建设者拥有丰富的实践管理经验,而并非闭门造车可以产生的。比如,倘若没有深厚的技术和经验积淀,很难设立准确的阈值,设的高了,意味着小事件变成大事件了才为人所知;而设的低了,则动不动警报乱响,大惊小怪,白白耗费各种资源。再如,运维人员和管理人员对数据分析结果要求不同,运维管理平台就要提前明确这些各自不同的要求,从而生成符合需要的分析报表和函数图形。
- 上一篇:解析:大数据时代三个重要技术问题
- 下一篇:下面没有链接了

北塔软件BTNM产品 免费试用
相关文章
- ::是否可以对网管机自行重新安 12-03-16
- ::什么原因会导致BTNM正式注册 12-03-09
- ::在进行BTNM的试用注册时,需 12-03-07
- ::配置管理如何应用,能达到更 12-03-06
- ::当需要记录大量的历史记录时 12-02-16
- ::有时会发生UPS无法监控的情况 12-02-16
- ::在BTNM中,能否设置几个告警 12-02-16
- ::告警日志想要删除怎么办?如 12-02-10
- :: 十年IT运维谈(六): IT运 13-07-02
- ::十年IT运维谈(五):要专业 13-06-26
- ::十年IT运维谈(四)IT部门, 13-06-13
- ::IT运维管理:网管软件时代的 12-02-06
- ::网管软件需要解决定位故障根 11-05-15
- ::网管软件应该具有哪些功能 11-05-12
- ::网管软件采购指南:简化购买 11-04-26
- ::大型数据中心的运维管理平台 13-09-26
- ::解析:大数据时代三个重要技 13-09-24
- ::进入云存储时代网络管理者应 13-09-17
- ::IT运维人员心声:大佬,请你 13-09-17
- ::北塔BTNM 北塔BTIM 北塔BTDM
- ::北塔电力行业解决方案
- ::北塔金融行业解决方案
- ::北塔政府行业解决方案
- ::北塔教育行业解决方案
- ::北塔能源行业解决方案