如何让运维质量全面达成运维服务管理体系系目标

信息网络运维项目质量目标_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
信息网络运维项目质量目标
上传于|0|0|暂无简介
阅读已结束,如果下载本文需要使用1下载券
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩8页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢服务监管框架下的IT运维服务与绩效管理体系建设
服务监管框架下的IT运维服务与绩效管理体系建设
(广州工程技术职业学院,广东广州 510075)
摘要:IT运维服务的质量问题越来越引起相关客户和服务提供商的重视,对IT运维服务外包项目进行监督管理是一种较新的探索。建立三权分立的运维服务组织管理框架、采用螺旋迭代式项目实施策略,对IT运维服务监督管理及其咨询项目的成功实施具有一定的积极作用。PPMTC运维服务管理实施框架和四维一体运维服务绩效管理模型是IT运维服务管理及其绩效管理体系建设的有效方法,通过其管理体系的建立,可从根本上解决IT运维服务的质量问题。
关键词:IT服务管理;IT运维服务监督管理;三权分立;螺旋迭代;服务绩效管理;管理体系建设;四维一体;PPMTC实施框架
中图分类号:C931.2;F272.92;C932.2
文献标识码:B
Management System Construction under Service Regulatory
Framework for IT Operation Service & Its Performance
FENG Wan-gui
(Guangzhou Institute of Technology, Guangdong Guangzhou 510075, China)
Abstract: The quality issue of IT operation maintenance services has drawn increasing attention of customers and service providers. The supervision and management for IT operation maintenance services outsourcing project is a relatively new exploration. The construction of organization management framework by the separation of powers, using spiral iterative project implementation strategy, has some positive effects for the successful implementation of the supervision and management and consulting projects for IT operation maintenance services. PPMTC implementation framework, and the four-dimensional integrated model of performance management, is effective method for the construction of IT operation maintenance service management system and its performance management system. The establishment of the management system can be a fundamental solution for the quality problem of IT operation maintenance services.
Key words: IT Service M Supervision and Management for IT Operation Maintenance S Separation of P Spiral Iterative S Service Performance M Management System C 4-Dimensional Integrated M PPMTC Implementation Framework
信息化在提升企业的运营效率和核心竞争力的同时,也使企业对信息化的需求和依赖程度不断提高,而IT运维服务作为现代服务业的重要组成部分,为企业信息化提供了强大的支撑。因此,IT运维服务越来越受到各级政府和各类企业的重视。在IT运维服务业蓬勃发展的同时,IT运维服务的质量问题也引起了相关客户和服务提供商的关注。在现阶段各IT
第 1 页 共 8 页
服务监管框架下的IT运维服务与绩效管理体系建设
运维服务提供商的服务交付能力和水平良莠不齐的情况下,对IT运维服务开展监督管理、以及相关的管理研究,具有非常重要的现实意义和实用价值。
笔者有幸参加了W公司所承接的广州市某信息网络中心运维服务监督管理项目(以下简称本项目)。在提供本项目的服务过程中,笔者在充分调查了解客户的运维服务现状、并建立IT运维服务管理体系的基础上,综合应用平衡计分卡(BSC)、关键绩效指标(KPI)、目
[1]标考核法(MBO)、综合指标考核法(德能勤绩)等绩效考核方法论,在全面参考相关运维
[2][3][4][5]服务绩效考核的理论和实践研究结果的基础上,根据IT运维服务的特点,结合客户
的实际情况,为客户建立了一套IT运维服务绩效管理体系并实施成功。本文将笔者在本项目中的主要实施过程和方法进行介绍和展现,希望能够给同样关注IT运维服务质量、以及正在研究或者实践IT运维服务监督管理工作的同行们一点启发和帮助。
一、 对客户需求与服务现状的调研和分析
笔任何服务质量的改进都是源于对客户需求的高度关注和对服务现状的调研和分析。
者在介入本项目之初,就将重点工作放在对客户需求的调查了解、以及对IT运维服务现状的调查与分析两个方面。
通过与客户方及其运维外包服务团队的充分交流、以及对运维服务情况的现场调研,并调阅和分析了本项目的招标文件、投标文件、项目合同书等相关资料,笔者了解到客户对本项目的实施寄予了非常高的期望,其项目目标主要包括以下三个方面:
1. 希望通过本项目建立一套规范有序的IT运维服务管理体系,实现人员、技术装备和流程的标准化管理。通过该体系的建设和持续完善,促进运维工作标准化、规范化,满足IT运维工作集约化、精细化管理的要求,保障服务水平的持续提升。
2. 希望通过本项目建立一套IT运维服务绩效管理体系。运行指标体系要覆盖系统连续性服务能力、系统可用性、人员服务能力、项目管理等方面,通过服务指标监控和运行分析,实现对运行服务的集中、分级管理和监控,并能够及时调整运行和维护策略,促进运维服务质量和服务效率的提高。
3. 希望通过本项目建立一套有效的服务实施质量内控体系,实现对运维服务项目服务方的服务质量进行精细化管理,确保运维工作高效执行,降低实施风险,保障运维服务工作的正常运行。
这三个方面的项目目标都需要事先建立起一套先进有效的运维服务监督管理组织框架,在这个组织框架中至关重要的是要理清运维服务的客户方、监督管理方、外包项目总包方、外包项目分包方等多方之间的关系,并在此基础上建立起科学的组织管理框架。然后,在此组织管理框架下,通过IT运维服务管理体系建设和IT运维服务绩效管理体系建设建立起一套完备的运维服务管理制度和标准,最后根据这套制度和标准开展IT运维服务的日常监管和审计工作,从而形成一套有效的服务质量内控体系。
二、 运维服务组织管理框架的建立
在理清了本项目的基本实施路线之后,笔者便开始着手建立其组织管理框架。鉴于本项目的特殊环境和客户需求,笔者最终将各方的角色定位如下:
1. 客户方:承担IT运维服务外包管理者的角色。另外,由于客户方的运维部在服务外包以前长期提供IT运维服务的原因,运维部的技术人员对客户方的IT环境和相关技术有时候甚至比服务提供商的技术人员更加熟悉,所以,客户方的运维部技术人员在逐步转变为外包管理者角色的过程中,仍然需要兼任技术专家的角色,为服务提供商的技术人员提供必要的技术咨询。
2. 监督管理方:承担IT运维服务管理咨询顾问和IT运维服务审计的角色。在运维服
第 2 页 共 8 页 [6]
服务监管框架下的IT运维服务与绩效管理体系建设
务组织管理框架、运维服务管理体系、运维服务绩效管理体系的建设阶段,监督管理方主要承担IT运维服务管理咨询顾问的角色;在基本建立运维服务管理制度和标准以后,主要承担IT运维服务审计的角色。
3. 运维服务总包商项目经理:应承担IT运维服务外包的整体项目管理者的角色,负责运维服务整体项目的日常运营管理,包括各分包商所承担的项目。同时,总包商对自己所承担的分包项目,应设立独立的子项目经理,负责所分包项目的日常运营和现场管理工作。
4. 运维服务分包商项目经理:应承担IT运维服务外包子项目的项目管理者角色,负责所分包项目的日常运营和现场管理工作。
5. 运维服务项目团队:各分包商服务团队(包括总包商所承担的子项目服务团队)均承担服务提供者的角色,负责所承担的子项目的日常运维项目实施和服务交付。
在上述角色定位和职责分工的基础上,由客户方、监督管理方、总包方、各分包方选派领导和项目管理人员组成运维服务管理委员会,由委员会对建立的各种管理制度和标准、以及日常监管中遇到的重大问题进行讨论和决策。这样,本项目的组织管理框架(如图1所示)
[7]也就实现了立法、执法、司法的三权分立与制衡,从而初步形成了运维服务质量内控体系
的组织管理基础。
图1 IT运维服务组织管理框架
Fig.1 Organization Management Framework of IT Operation Maintenance Service
在上述组织管理框架下,很多日常管理工作流程的问题也就迎刃而解了。例如在监督管理方介入项目后,运维服务管理制度的形成过程一直存在较大的争议,但在上述组织管理框架下,运维服务管理制度的制定由于属于运维服务项目管理的范围,所以就理所当然地由总包方项目经理负责拟定(项目管理者角色),监督管理方负责指导并提供咨询意见(咨询顾问角色),最终由运维服务管理委员会决策后正式执行,这样就使许多复杂的问题简单化。
三、 螺旋迭代式项目实施策略与方法
在上述组织管理框架下,与常规IT运维服务外包项目不同的是,增加了一个监督管理方,这是本项目在运维服务监督管理方面进行的有益尝试。开展对运维服务的监督管理,在国内都是比较新的探索,这对监督管理方如何成功完成本项目,是一个比较大的挑战。而且,在本项目中,要让建立组织管理框架、建立IT运维服务管理体系、建立IT运维服务绩效管理体系、开展日常运维服务监管和审计等这些本来具有前后衔接关系的工作,
在本项目中同
第 3 页 共 8 页
看过本文章的还看过。。。
服务监管框架下的it运维服务与绩效管理体系建设_生产经营管理_经管营销_专业资......
暂无评价|0人阅读|0次下载|举报文档 it运维体系建设_互联网_it计算机_专业资料...门的cobit(it治理控制框架)、6∑绩 效考核管 理办法和pmp项目管理方法等 。.........
暂无评价|0人阅读|0次下载|举报文档it运维绩效考核...网络系统安全管理 网络、系统服务正常 运行时间 团队...团队建设 指标说明 权重说明 考核结果 核算说明 考核.........
暂无评价|0人阅读|0次下载|举报文档it运维服务工作...it运维管理框架 it运维管理系统参考模型 it组织管理...运维绩效管理层 运维流程管理层 资源监控管理平台层 .........
暂无评价|0人阅读|0次下载|举报文档运维服务质量保障...iso 20000it 服务管理体系认证,国际软件 cmmi 能力...c) 绩效考核 建立与运行维护服务相关的绩效考核体系.........
暂无评价|0人阅读|0次下载|举报文档it运维服务工作...it部门缺少展示 其工作绩效的数 据 企业领导对it运...it运维管理框架 it运维管理系统参考模型 it组织管理.........
暂无评价|0人阅读|0次下载|举报文档it运维服务工作...it运维管理框架 it运维管理系统参考模型 it组织管理...运维绩效管理层 运维流程管理层 资源监控管理平台层 .........
暂无评价|0人阅读|0次下载|举报文档 运维服务方案(全)-10(框架)_计算机软件及...化资产管理 第2 页 第2章 章 运维服务管理体系建设 1 it 服务管理概述.........
暂无评价|0人阅读|0次下载|举报文档运维管理体系_生产经营管理_经管营销_专业...iso 20000让it管理者有一个参考框架用来管理it服务。 7 各流程关联关系供应商.........
运维绩效考核_人力资源管理_经管营销_专业资料。民腾运维工程师绩效考核方案为了实现员工收益与能力和付出相对等,提高员工的工作积极性, 实现按劳分配,特制定如下.........
? ? it 运维管理是时下 it 界最热门的话题之一.随着 it 建设的不断深入 和完善,计算机硬软件系 统的运行维护已经成为了各行各业各单位领 导和信息服务部门.........
7 安全管理 各种资源权限分配,执行好当前流程并做好权限相关资料的记录 共享服务...it运维部门的绩效考核怎... 4页 1下载券 广电网络-运维系统绩效考... 11页.........
在运维之初,规划符合行业与监管标准的 信息安全政策与制度,建立一系列运维框架,...二、 监控体系 运维 0 倡导实现 it 管理与业务服务的融合, 建立面向 业务.........
暂无评价|0人阅读|0次下载|举报文档xxxit运维监控管理...并调度资源解决问题,形成 it 运维管理主动服务 的新...并与行业关于信息系统安全体系建设的要求密切结合。 .........
it运维管理建设方案交流 v2_互联网_it计算机_...服务体系化 ?流程标准化提供数据 相关sla事件信息 ...完善服务能力评估体系及绩效考核机制 ? 建设服务需求.........
2002 bexcel management consultants all rights reserved 普通汽车服务绩效管理框架性方案(分报告 三)2002 年 11 月 20 日 报告说明 建立绩效管理体系的目标 普 .........
运维管理体系规范等 北京市科学技术委员会it服务管理...服务持续支持 精细考核合理优化 it运维建设的建设意见...重大故障决策绩效考核 监控平台建设思路 监控管理平台.........
it 运维问题分析报告为提高 it 运维用户服务感知满意度,提高运维工作效率,完善运维基础设施 建设,现对 it 运维工作中存在的紧迫性问题进行分析总结,报告如下: 一.........
... 用友it服务管理框架模型 用友公司基于26年的it运维服务管理领域的研究与实践...绩效管理体系设计 abu服务组织规划 问题管理流程梳理 it服务管理体系建设咨询 it.........
it 运维管理行业政策环境分析 一、行业监管体制 二、行业相关政策 三、行业发展规划 四、行业标准体系 五、行业相关发展规划 1、软件和信息技术服务“十二五”发展.........
■ 24小时热门信息
各级运行维护管理部门可结合各地的实际情况制定 3 合星普惠 it 运维管理制度 相应实施细则,实施细则不能更改或违犯总的原则。对于 特殊情况,要详细说明并上报总部.........
2、编制方法 、本实施细则包括it运维服务全生命周期管理方法、 管理标准规范、 管理模式、 管理支撑工具、管理对象以及基于流程的管理方法。 本实施细则以itiliso.........
某部it 运维管理体系建设案例 摘要: 某部委信息中心(以下简称中心)肩负着电子...并清晰定 义 it 服务的考核目标,按照管理流程、角色岗位进行分解,配套实施支持.........
it运维管理系统管理制度_计算机硬件及网络_it计算机_专业资料。信息中心机房,设备...本管理制度的审核人:xx 本管理制度的批准人:xx 本管理制度自发布之日起实施。.........
■ 相关热门内容
运维的目标价值体系_生产经营管理_经管营销_专业资料。运维的目标价值体系运维...所有的运维团队都在这些维度 提出自我要求,从而不断去驱动运维平台和规范的建设.........
某it运维管理项目建设规划_计算机软件及应用_it计算机_专业资料。实战it运维管理项目it运维管理体系建设规划 项目建设需求 项目目标与蓝图 项目建设思路与方法论 项目.........
运维体系建设介绍 及公司运维现状与展望 第 1页 目录运维部门的价值与挑战运维...正式上线已经一年多, 运行稳定,达到了预期的目标 解决方案 投资估算 效益分析 ?.........
it 运维管理系统建设以 信息中心为全局管理核心,辐射各区、市、县局、业务处队...工程目标:实现对 网络、主机、数据库、应用的运行状态的统一监控;使日常的运维 .........
xxxit运维监控管理平台建设方案(参考)_计算机软件及应用_it计算机_专业资料。it...体系架构是一个完整的 it 系统运维管理架构, 是 it 综合运维管理 的较高目标.........
×××在运维管理体系建设过程中的核心方法论,包括但不限于如下内容; ? ? ? ? ? ? ? ? 将以客户需求(最终结果)为导向的管理目标作为核心设计思想 以客户.........
it运维服务体系建设思路_it计算机_专业资料。中国人民银行省级数据中心 it 运维服务体系建设,应包含运维服务制度、流程、组织、队伍、技术和对象等方面的内容。同时.........
运维工作内容规划“用心服务” 品牌申请 1 2 3 ......
■ 热门推荐您的访问出错了(404错误)
很抱歉,您要访问的页面不存在。
1、请检查您输入的地址是否正确。
进行查找。
3、感谢您使用本站,3秒后自动跳转至网站首页指南连载:数据中心运维管理框架详述
出处:PConline&
作者:顾大伟 郭建兵 黄伟
责任编辑:xujian1&
6.2.3.运维管理的流程要求  数据中心建立的管理流程除应满足数据中心自身特点外,还应能兼顾客户、管理者、服务商与审计机构的需求。由于每个数据中心的实际运维情况与管理目标存在差异,数据中心需要建立的流程也会有所不同。为能让读者对数据中心运维管理流程可能涵盖的范围有一个较为全面、规范的了解,本节以基于ISO20000、ISO27001、ISO9001和ITIL等标准要求而建立的商业数据中心为例,介绍数据中心在运维管理流程建设方面的要求。  1.运维管理流程的范围  数据中心管理框架应包含以下七个管理领域:  (1)体系管理平台:以ISO9001质量管理体系框架搭建的管理平台作为管理接口。管理层通过这些流程制定管理方针目标,测量目标的执行,监督流程管理效果,执行PDCA(即Plan、Do、Check和Action)循环,以改进数据中心绩效,管理数据中心各类资料文件。  (2)资源管理域:包含数据中心内部人员、网络、设备、基础设施、环境等资源的管理流程,是数据中心统一管理的内部资源。  (3)服务管理域:包括与客户交互的相关流程文件,是数据中心与客户的管理接口。  (4)服务支持管理域:包括数据中心内部运作过程中的事件、问题、变更、发布处理流程等。  (5)服务交付管理域:数据中心财务管理、服务的策划和变更、可用性管理、容量管理、业务连续性管理等方面的管理内容。  (6)资源信息管理域:包括数据中心的信息资产管理、配置管理、输入/输出管理、风险评估等工作的管理。  (7)厂商管理域:包括服务商管理的相关流程,是服务商与数据中心管理的接口。  以上7个管理域所构成的管理体系框架内的流程,按照ISO9001标准的要求被划分为4阶文件。  第一阶文件是&手册&,包含体系管理平台部分的全部文件。用于管理层对整个管理体系进行管理,制定方针目标、进行管理评审等工作。  第二阶文件是&指南&,该阶文件根据数据中心各部门的职责规定了某一具体业务的流程,并涵盖了除&体系管理平台&外其余6个管理域的文件。公司管理层可以通过这一阶文件规定各部门的工作范围及业务在各部门间的流转过程。  第三阶文件是&工作指引&,是数据中心各部门根据第二阶文件要求编写的具体部门的具体业务操作手册。同样涵盖了除&体系管理平台&外其余6个管理域的文件。该阶文件是数据中心各部门管理其内部工作的重要依据,也是员工执行管理体系的指导文件。  第四阶文件是&支持性文件&,包括支持业务流程运行的各类表单、技术文件。该阶文件记录数据中心各项业务流程运行的具体情况,还可作为体系运行结果的直接证据。  2.体系管理平台  体系管理平台用于管理层对整个管理体系进行管理,制定方针目标、进行管理评审,持续的改进数据中心的各项流程制度。它是以ISO9001质量管理体系为基础搭建的管理整个数据中心运维管理体系的管理平台。主要作用有两项:  (1)为数据中心的管理层提供管理整个数据中心运维体系的界面。数据中心通过管理平台内的流程,进行方针、目标的制定、企业内部资源的分配、流程文件的修订发布、管理流程执行效果的审核、管理评审、运维数据的收集评审、执行持续改进运维体系的措施、调整管理体系框架等工作。  (2)为外部审核机构及客户了解数据中心的管理体系框架提供参考。  体系管理平台的文件主要包括8个,分别是:  (1)管理手册:描述管理体系的框架结构、执行范围、组织结构及各部门的主要职责。  (2)适用性说明:描述管理体系所遵循标准的适用条款及不适用条款的说明。  (3)文件管理手册:用于规定数据中心管理体系内的文件修订、发布、废止、文件版本控制、文件标示控制、文件保管的规定、文件的废止销毁流程。  (4)记录和资料管理手册:用于规定各类文件资料的保密等级及使用权限控制规定、查阅权限及保密资料的查阅申请流程、记录资料的保管规定(例如,保管期限、保管部门、记录资料的作废、销毁规定等)。  (5)内部审核手册:规定了数据中心进行内部管理体系审核的周期,审核范围,内部审核员的选用方式,执行内部审核的流程,各部门在内部审核中的职责,审核后的纠正预防措施的制定、执行工作,纠正预防措施执行效果的监督检查工作。  (6)纠正预防措施手册:用于规定整个管理体系在审核、管理评审过程中发现的需改进工作的纠正预防措施的制定、执行、监督检查工作的流程,以确保纠正预防措施被有效落实。  (7)管理评审手册:用于管理层评估管理体系的运行效果,评估公司各项方针指标的执行情况,修订方针、目标,适时修订体系文件。  (8)不合格控制手册:规定了服务不合格的概念及发生服务不合格后的处理方法。  3.资源管理  数据中心资源管理所涵盖的范围很广,包括环境管理、网络管理、设备管理、软件管理、存储介质管理、防病毒管理、应用管理、日常操作管理、用户密码管理和员工管理等。  1)环境管理  数据中心环境安全管理的重点在于如何根据不同区域的特点使用不同的安全管控和出入原则。对重点的区域可以选用先进的安全设备,使用严格的进出管理控制制度进行管理。  在制定数据中心环境管理相关文件时,通过对各区域内所存放的信息资产的等级进行分析,将数据中心划分成不同类别的管控区域和安全区域。建议至少划分为3类区域:公共区域、办公区域、安全管制区域。  (1)公共区域:这些区域通常用于数据中心生活与展示的配套区域。该区域允许员工及获准进入数据中心的第三方、客户在遵守相关制度的前提下自由进出。  (2)办公区域:数据中心内存放日常行政办公信息处理设备和其他办公设备,开展日常工作的区域。这类区域的进入通常需要办理相关的进入申请,配备有视频监控系统。  (3)安全管制区域:数据中心内存放核心信息处理设备和供配电等基础设备,开展一线服务工作的区域。这类区域严格限制人员设备的进出,有先进的门禁及监控系统以确保信息系统安全。  在编制环境管理相关流程时应考虑人员进出的要求,还应考虑设备和物品进出的流程。设备和物品的进出应得到正式的审批,特别是对于安全管制区域所有的IT类设备、存储介质应重点控制。  2)网络管理  网络作为数据中心重要的资源,应制定相关流程予以控制。建议网络管理流程包括如下管理内容:  (1)网络拓扑结构:应明确网络的拓扑结构,创建网络拓扑结构图,并在网络结构变化时及时更新拓扑图。网络拓扑结构的变化应有记录并得到适当的审批,应有专门的人员负责网络拓扑结构的调整。  (2)网络的访问管理:应将网络划分为不同作用的网段,例如办公网、生产网、管理网,公共网络。规定有权访问各类网络的设备和人员,明确网络接入的申请、审批流程和终止接入的流程,做到网络接入、终止接入过程受控,有专门的人员负责网络接入和终止接入的管理工作。  (3)网络系统日常维护流程:应有专门的工作指引用于指导网络设备的日常维护,日志的备份、配置信息的备份。  3)设备管理  数据中心的设备管理主要包括对设备的固定资产管理,设备维护管理等。数据中心在起草相关流程文件时应关注以下几点:  (1)编制设备清单:明确设备的所有者、管理维护人员或部门、开始使用的日期、设备的重要等级等信息。此类信息最好悬挂或张贴于设备上或设备周边的醒目位置以便于管理。  (2)制订设备的维护计划:规定具体设备的维护日期、维护人等信息,并由专人负责按照维护计划进行维护或联系、督促服务商执行维护。  (3)将设备按重要等级进行分类:设备按照等级分类,并按不同的设备重要等级制定不同的管理策略,最大限度的确保重要设备的运行。  4)软件管理  数据中心软件管理通常需要关注以下三项内容:  (1)计算机系统安装软件的管理:对于数据中心的办公用计算机、监控用计算机和生产用计算机来说,其安装的软件应该受到严格的控制,避免员工随意安装软件。从软件管理角度,数据中心应建立可安装软件的认证工作,通过对软件使用的分析建立一张可安装软件的清单,对于清单范围外的软件不允许安装。对于监控、生产用的计算机及可连入生产网的计算机,其安装的软件需经过认证,并对所安装的软件进行记录,定期检查是否存在使用其他软件的情况。  (2)软件维护及补丁管理:随着各种利用安全漏洞的病毒和恶意程序的增多,软件维护和补丁的更新工作也显得极其重要。对于软件补丁的安装管理应做好以下几项管控工作:补丁的测试、补丁的发放和安装、版本控制,建议补丁的管理由专人负责。  (3)数据中心软件许可证的管理:随着知识产权意识的提高,是否使用有合法许可授权的软件已经成为越来越多数据中心和客户关注的问题。软件许可证的管理要作为数据中心的一项重要工作。其重点在于管理数据中心所拥有的合法软件许可证,确保在许可证许可范围内使用软件,确保软件的安装有记录可查。  5)存储介质管理  数据中心经常面临大量的介质管理工作,介质管理工作的成功与否直接影响数据中心的信息安全。一个良好的介质管理工作应包括以下几方面的内容:  (1)空白介质与有数据介质保存方式的规定:两种介质分开保存并有明显标示以示区别,同时应明确介质的保存地点,做到介质统一保存。  (2)应制定统一的介质编号、标示原则:对介质作统一的编号标示,便于介质管理。  (3)有条件时建立介质管理员制度:确保介质的专人管理,可减少介质管理的混乱。  (4)有数据介质的领用查阅应得到控制:介质领用、报废应有适当的审批过程。应规定清除报废介质内残余数据和销毁处理报废介质的流程,避免信息泄露。  6)防病毒管理  随着计算机病毒的日益泛滥,防止数据中心的生产设备、办公设备受到病毒侵害已经成为数据中心管理中不可缺少的工作内容。防病毒管理流程主要包括以下几个方面:  (1)防病毒软件的管理:这里主要包括软件的安装、软件的设置、病毒库更新,软件版本控制、定期查杀病毒等。  (2)病毒资讯:安排专人随时了解病毒最新信息,可能爆发的病毒类型、染毒后现象及对信息系统的影响,查杀方法等,并将这些信息通过定期通告和随时通报两种方式提醒数据中心相关人员查防。  7)应用管理  广义的应用管理包括了数据库、中间件和应用系统本身在内的所有管理。它是绝大多数IT服务的&灵魂&。对于数据中心而言,挑战在于要同时管理大量复杂并且相互关联的应用。在这种情况下,除了要建立并运用同样适用于整个应用管理的ITIL流程外,几个适合数据中心应用管理的最佳实践是:  (1)将应用按重要程度进行分级。毫无疑问,理想情况下,所有的应用都应视为同样&重要&。但是在资源总是相对不足的现实情况下,必须区别对待。因此,在管理数目众多的应用系统时,基本的一点就是根据应用系统所提供的IT服务的重要性来对应用系统进行级别划分,并以此进行归类。这个级别的定义可以提供应用系统管理维护所涉及的多个流程,包括事件管理、问题管理、安全级别管理等最基本的信息。例如,一个一类应用(最重要)中断1小时和一个四类应用(相对最不重要)中断1小时,显然事件的等级是不一样的。所以,将应用按重要程度进行分级对于更为合理的分配资源有重要意义。  (2)制作应用地图。首先要制作系统结构图和网络拓扑图,同样,还需要制作应用拓扑图,也称为应用地图。如图6-7所示,应用地图将应用按其功能类别划分为应用群,赋予不同的色块标识进行布局,使其便于统计和管理。一个应用占用一行或一列,在这行或者这列中,从首到尾,分别在每一格列出网络设备、服务器、数据库、中间件,最后是应用。每一格都可以再标示出具体的信息,如服务器的型号,数据库的版本,应用的名称和版本等,从而清晰地表现出各个应用相关的最主要信息。应用地图是快速了解总体应用部署情况,并在应用出现故障时,迅速定位原因,最为直观有效的形式之一。图6-7应用地图  (3)了解应用数据流。虽然应用地图可以帮助快速了解应用和基础系统之间的关系,但是应用和应用之间的逻辑关系却没有展现。所以,对于数据中心而言,深入研究并绘制多个应用系统之间数据的流向是有必要的。应用数据流可以用图形,也可以用表格来表示。应用数目较少时,用图比较直观;但当应用数目超过一定量时,表格的形式就更为合适。但不管是用图,还是用表,应用数据流都应该至少包含以下几个元素:数据提供的应用系统名称(一般称为上游应用)、提供的数据类型、文件名称、时间、周期、本应用系统名称以及数据接收的应用系统名称(一般称为下游应用)等。如图6-8所示,针对任何一套应用系统,通过应用数据流图,可以很清楚地知道一旦停运,对其他应用系统的影响,这对于事件、问题或变更的影响评估有非常重要的意义。图6-8应用数据流图  8)日常操作管理  数据中心的日常操作管理主要包括数据中心内部生产系统、办公系统、动力设备、环境保护、监测系统的数据处理、操作、维护的管理,以及数据中心信息处理设施、基础设施设备的软硬件运行情况巡检等监控工作的管理。  数据中心应该为每一台设备编制相应的操作工作指引。不建议以服务商或设备制造商提供的使用说明书或技术资料直接作为工作指引使用。工作指引编制应该满足数据中心实际使用的需要,用于指导操作人员在实际环境下操作设备的各项功能。  建议制定相关的巡检工作指引,规范数据中心的日常巡检工作。工作指引应规定巡检的周期、巡检项目、判定设备正常的标准、出现异常后的记录和汇报方式以及事件管理的接口。对巡检设备及内容做成检查表,巡检记录以表格形式呈现。  9)用户密码管理  用户密码是数据中心运行的重要信息。用户密码的妥善管理可以减少数据中心运行的风险,提高数据中心运行的效率,确保信息的安全。  用户密码管理不完善的数据中心可能会遇到如下问题:  (1)管理员密码丢失(忘记密码)。  (2)登录时发现密码不正确,不知是谁改过。  (3)需要对系统进行调整时发现管理员休假,但只有他有密码,所以系统调整工作只能暂停。  (4)管理员偶然发现系统里有一个未知用户,经查发现该用户属于一个曾经在数据中心工作的人员,该人员已离职半年,但该用户没有被删除。  这些都是用户密码管理不完善的结果。一个良好的密码管理流程主要应包括以下几个方面:  (1)用户密码分级管理:数据中心应根据密码的重要程度将密码划分为若干个等级,并对不同等级的密码采用不同的管理策略。  (2)明确用户密码创建、变更流程:用户密码的创建、变更和使用应该有一套严格的流程进行控制。避免不受控的密码创建、变更和使用的行为。  (3)用户密码的使用中应注意以下问题:  ①一个用户密码只能一人使用,避免出现几人共用一个用户密码的现象。  ②用户密码的使用和生成应由不同人员分别进行,避免密码使用者私自修改密码。  ③密码必须定期修改。  ④密码的强度需要事先被定义。  (4)密码的保管:对于重要密码,除在用户处保留外还应在适当的地点另外保留密码副本,以避免由于密码遗忘、丢失对数据中心运行造成严重影响。此外,建议使用密码信封管理密码。当密码保存在密码信封后,密码信封本身的制作、保存、更新应制定相应流程,以确保密码信封的管理是受控和安全的。  (5)用户密码的撤销:数据中心应建立一套用户密码撤销删除的流程,重点加强离职人员及工作调动人员所用密码的撤销管理。  10)员工管理  员工作为数据中心重要的资源需要进行有效管理。数据中心的员工管理流程应包括:  (1)员工招聘、任用流程。明确员工招聘任用的流程,明确签订劳动合同和保密合同的过程。  (2)员工培训流程。数据中心属于技术密集型组织。由于IT领域新技术、新产品层出不穷,所以确保员工获得相关的技术和能力培训显得至关重要。应规定员工接受培训的流程,员工培训主要包括上岗培训和日常培训。  (3)员工离职及岗位调整流程。员工离职或岗位调整后,应完成各种工作交接,并应收回各类技术资料、系统权限、网络权限、出入证件、门禁系统权限。  4.服务管理  1)服务水平管理  服务水平管理是ISO20000、ITIL的重要组成部分,也是数据中心管理的重要组成部分。服务水平管理主要通过SLA(服务水平协议)/OLA(运维水平协议)/UC(支持合约)来协调IT服务各方之间的关系。服务水平管理主要管控如下活动:  (1)识别客户需求:制定与客户沟通的相关职责,获取客户需求。完成SLR(服务级别需求),作为制定SLA的重要依据。  (2)定义服务项目:在确定SLA后,服务级别管理人员需要根据SLR总结出满足客户需求的服务项目,并形成服务描述单和服务质量计划。  (3)签订协议:服务级别经理组织签署服务支持合同和运作级别协议,签署SLA。  (4)服务级别的监控和报告:编写流程对服务级别协议执行的效果进行监控并形成报告。  (5)评审和改进:服务级别经理应评审服务级别协议执行状况并作相关改进计划。  2)业务关系管理  业务关系管理流程包含至少3个部分:服务评审、客户满意度调查、客户抱怨管理。  (1)服务评审:与客户进行定期或不定期的针对服务提供情况的沟通。每次的沟通均应形成沟通记录,以备数据中心对服务进行评价和改进。  (2)客户满意度调查:客户满意度调查流程主要包括客户满意度调查的设计、执行和客户满意度调查结果的分析、改进4个阶段。数据中心可根据客户的特点制定不同的客户满意度调查方案。  (3)客户抱怨管理:客户抱怨管理流程规定数据中心接收客户提出抱怨的途径,以及抱怨的相应方式,并留下与事件管理等流程的接口。应针对客户抱怨完成分析报告,总结客户抱怨的原因,制定相关的改进措施。在实际工作中,有些重要客户的抱怨或客户抱怨的严重问题对数据中心影响较大。为及时应对客户的抱怨,应该规定客户抱怨的升级机制,对于严重的客户抱怨,按升级的客户投诉流程进行相应处理。  3)服务报告管理  服务报告管理流程旨在向客户和管理者提供与服务相关的数据和信息。在服务报告管理流程中应明确以下几个要素:  (1)服务报告各类数据的获取途径。做到一类数据只能由一个职能部门提供。  (2)服务报告的内容定义。应确保和管理层、客户就相关服务报告的内容达成一致。  (3)服务报告的提供周期。应该明确服务报告的提供周期,具体周期可根据客户或管理层的要求定义。  (4)明确服务报告的制作部门和审批途径。  5.服务支持  1)事件管理  事件管理主要管控引起或可能引起服务中断或服务质量下降的不符合IT服务标准操作的活动。这里的事件不仅包括软硬件故障,也包括服务请求。当处理多个事件时应根据事件的影响、紧急程度、解决事件的难易决定事件的优先级。如在协议时间内无法解决事件还应考虑事件的升级流程。  事件管理流程与问题管理、服务水平管理、变更管理、配置管理有着复杂的联系。在制定数据中心的事件管理流程时应充分考虑事件管理与这些流程的关系和接口。下面通过事件管理流程简图来简单介绍事件管理的过程,如图6-9所示。  首先是事件的发起,在这张流程图中,数据中心的事件发起主要包括3个方面:客户请求、数据中心自动监控系统提供的报警、数据中心日常巡检中发现的异常。  在事件发生后,事件记录员首先记录该事件。在事件管理流程中应规定记录事件的内容,如果数据中心没有使用ITSM的电子化工具,应通过表格形式记录事件内容,表格的具体样式、内容,可根据实际业务特点设计。  在事件记录员记录事件后,事件经理可根据事件记录对事件进行初步支持和事件分类,在这一步,事件经理需要对事件的紧急程度、重要等级、事件影响和处理难易进行初步分析,由此确定事件的优先级。把事件设计的配置项关联到配置管理数据库(简称CMDB,指记录每个配置项(CI),以及不同配置项之间重要关联详情的数据库),分配事件处理任务到相关受理人员。  在事件经理分配任务后,事件受理员需对事件进行分析和处理。处理事件时可参考问题管理的相关信息。  在事件分析并给出解决方案后,进入事件的解决过程。事件的解决通常需要通过变更管理流程进行。所以,这一步需要留下变更管理的接口。在处理完事件后,需要和问题管理交互信息。  当事件确认解决后,由事件记录员关闭事件。  2)问题管理  问题管理流程是通过调查和分析IT基础架构的薄弱环节,查明事件产生的潜在原因,并制定解决事件的方案和防止事件再发生的方案。与事件管理强调处理速度不同,问题管理是强调查处事件的根源,从而制定恰当的解决方案,防止类似事件再次发生。  通常问题管理与事件管理、变更管理、配置管理都有很紧密的联系。下面以问题管理流程图(如图6-10所示)为例,介绍问题管理的主要活动。  数据中心问题管理部门通过对事件等信息的分析提出问题,并由问题管理员记录该问题。  问题经理对问题进行分析和处理。该部分工作主要包括以下4项:  (1)将问题关联到事件管理流程记录的相关事件。  (2)将问题关联到配置管理项。  (3)设定问题的优先级。  (4)将问题分配给问题受理员处理。  问题经理将问题分派给问题受理员后,问题受理员通过分析,查找问题的原因并制定相关解决措施。  当问题的原因被发现并得到了解决措施后,应由问题经理管理问题,同时应通过变更管理进行相关变更,并通过配置管理流程更新相关配置项。  问题管理的最后一步是更新知识库。  问题管理流程本身并不复杂,但很多数据中心都不能很好地实施问题管理流程。通常大多数数据中心在实施问题管理流程时遇到的最大&问题&就是&找不到问题&,从而导致问题管理流程不能被真正实施。因此,建议采用如下方法发现数据中心的问题:  (1)充分利用服务报告,从报告中未能满足SLA的情况入手发现问题。  (2)充分利用事件管理流程,把具有相关性的事件作为问题管理的研究对象。  (3)利用系统管理工具的监测数据发现问题。  (4)通过客户满意度调查、客户座谈、客户反馈找出问题。  3)变更管理  变更管理是在最短的中断时间内完成基础架构或服务的任何一方面变更的流程。通常情况执行了一个问题管理流程、事件管理流程、服务水平管理流程后,需要通过变更管理实施事件管理流程或问题管理流程所产生的事件处理方案或问题解决措施。  变更管理在施行中应注意通过合理的计划和周密的准备把中断业务或服务的时间减少到最小。  下面就以变更管理流程图(如图6-11所示)为例,介绍变更管理的主要活动。  变更流程的启动:通常,事件管理流程、问题管理流程、服务水平管理流程会启动一个变更管理流程。变更经理需要对变更请求进行审批。在这个阶段,变更经理主要对变更请求进行复核,并确定变更的优先级,然后将变更分派给相应的变更受理员进行变更操作。  变更受理员根据变更的情况制定变更执行的详细计划,这些计划应尽量详细以减少由于变更时间过长而对服务的影响。应在制订变更计划的同时制订一个变更失败后的回退计划,以避免一旦变更失败对数据中心运维造成较大影响。  变更经理需要对变更受理员制定的变更计划进行审批,然后交由变更实施人员进行实施。变更实施后,变更受理员应对变更实施的结果进行检查,以确认变更执行有效,并将结果通报变更经理审批。变更经理审批完变更后,变更受理员可以关闭该变更流程。  6.服务的交付管理  1)容量管理  容量管理主要关注企业与IT基础设施之间的关系。这个流程不仅要评价现有服务的能力,还要分析和预测数据中心未来发展的需要。  容量管理流程应着重规范以下3个方面的内容:  (1)业务能力管理:关注数据中心未来业务对IT服务的需求,并确保这种未来的需求在制订业务能力计划时得到充分的考虑。  (2)服务能力管理:关注现有的IT服务能力、品质能否达到服务级别协议中所确定的服务目标。  (3)资源能力管理:关注IT基础架构内每个组件的能力和使用情况,并确保IT基础架构的能力足以满足支持服务级别协议被履行。  数据中心可通过编制能力计划的形式完成以上工作内容。  2)业务连续性管理和可用性管理  在当今以服务为导向和以客户为中心的业务环境下,维持数据中心的持续运维对数据中心具有重大意义。尤其在发生灾难的情况下如何确保数据中心的持续运作是数据中心管理人员必须关注的问题。  业务连续性管理就是负责数据中心预防灾难、增强IT基础架构在灾难发生后的恢复能力的管理流程。它着重确保数据中心在诸如地震、洪水、火灾、失窃、恐怖袭击、网络攻击、大范围停电等灾难后尽快恢复运作,减少因数据中心停止运行而带来的损失。  数据中心的业务连续性管理流程主要包括制定业务连续性目标、业务影响分析、灾难恢复应急预案三方面内容:  (1)制定业务连续性目标:它是数据中心制订业务连续性方案,进行风险分析的重要依据。确定数据中心发生灾难后可接受的业务停顿时间,是其主要内容。  (2)业务影响分析:指对可能造成数据中心业务中断的灾难事件进行分析,重点是分析其对应的场景、业务替代难易程度、对相关业务持续的影响、对数据中心整体发展的影响、灾难事件所发生的概率等。目的是筛选出最可能影响到数据中心持续运维的灾难事件场景,为制定应急预案确定前提条件。在进行业务影响分析时应关注:  ①场景的确定:从替代性风险、中断与否、影响程度、发生概率四个方面对不同场景的不同原因进行分析,找出风险值最高的场景原因,为灾难恢复计划的制订确立场景。  ②可接受风险值的确立:在综合衡量成本与各场景的风险值后,决定数据中心对风险值的接受程度,凡风险值高于可接受程度的场景均需制订灾难恢复计划。  (3)灾难恢复应急预案:应急预案是为确保发生灾难事件后,尽快消除紧急事件的不良影响,恢复业务的持续营运而制定的应急处理措施。应急预案的注意事项:  ①根据业务影响分析的结果及灾难场景的特点编写应急预案,确保当紧急事件发生后可维持业务运作,在重要业务流程中断或发生故障后在规定时间内恢复业务运作。  ②应急预案除包括特定场景出现后各部门、第三方的职责与任务外,还应评估复原可接受的总时间。  ③应急预案必须经过演练,使相关责任人熟悉应急预案的内容。  3)财务管理  IT服务的财务管理着重负责将IT服务运作中所包含的所有资源进行货币化管理。该流程主要包括预算编制、IT核算、服务计费3个主要内容:  (1)预算编制:预算编制是数据中心用于预测和控制费用开支的一个子流程。IT预算是由定期协商已设定的目标和对当前预算执行情况进行日常监督两部分组成。  (2)IT核算:IT核算是指对IT服务运作过程中和对服务相关的成本进行确认、计量和报告的过程。  (3)服务计费:服务计费是负责向使用IT服务的客户收取相应费用的子流程。服务计费包括资费对象的确定和计费方法的选择。  7.服务的资源信息管理  1)信息资产管理  信息资产管理是数据中心实行信息安全管理的重要基础,通过该工作可以让数据中心管理者清楚地知道自己的管理对象,以及这些管理对象的重要程度。这里提到的信息资产指的是数据中心内部与信息安全相关的实体与非实体资产。信息资产通常包括:硬件、软件、数据、文档、人员、商誉、服务商等。在考虑信息资产管理流程的建设时,需要关注以下几项内容,包括:识别信息资产、信息资产的分级管理、信息资产清单等。  2)配置管理  配置管理的目标在于,确保只有经过授权的组件才能在IT环境中得到应用,并对所有变更调整实施记录和跟踪。在配置管理中最基本的信息单元是配置项,所有的软硬件和各种文档,如服务器、环境、设备、网络设备、台式电脑、移动设备、硬盘、内存、CPU都可以是配置项。配置管理的流程主要包括配置管理规划与构建、维护配置数据模型与CMDB构建过程、配置项数据的维护、配置数据的审计等。  3)风险评估管理  风险评估管理流程是对数据中心信息资产的风险进行识别,制定弱化或消除风险的方案,并实施该方案的管理流程,也是ISO27001标准对数据中心管理的要求。制定这一流程可以使数据中心明确其风险分析方法和风险分析过程,并明确如何将风险分析结果落实到数据中心的管理制度之中,从而减小风险对数据中心信息的影响,提高信息的完整性、可用性、机密性。风险评估管理的工作主要包括:风险识别、制定风险可接受水平、选择安全控制措施三项工作。  4)输入输出管理  数据中心各类保密信息的输入/输出应得到有效控制。数据中心应制定相关流程管控保密信息的输入/输出流程。该流程所涉及的重点是对保密信息的识别和管理。保密信息必须有专人管理。保密信息的获取应得到批准,并从固定的渠道输入/输出,做到信息流动受控。  8.服务商管理  数据中心各类服务商的服务品质对数据中心向客户提供服务的品质有一定的影响。对于数据中心而言,服务商的管理流程至少应包含以下几个方面。  1)服务商的选择  在服务商选取原则方面,通常情况下应考虑该服务商在相关服务领域的资质、经验、运维情况及满足数据中心服务要求等方面的能力。  服务商选择的内部流程方面,通常应避免仅有一个部门负责服务商的评估工作,如果有可能,数据中心应至少由两个相关部门组成评估小组,从不同的方面提出对服务商的选择要求,并做评估。数据中心可以把对服务商的要求制成评分表用于对候选服务商打分,最后根据评估打分的情况确定服务商。  2)服务合同的签订  服务合同的签订是服务商管理的重要一环,数据中心应拟定签订服务合同的流程。如果服务商可能接触到数据中心的重要信息,还应和服务商签订保密合同以保护数据中心重要信息的安全。  3)服务商的定期考评  服务商开始为数据中心服务后,数据中心应定期对服务商的服务质量进行考评。考评周期可以根据服务商提供服务的性质和工作量选择,但一个服务合同期内至少应进行12次服务考评。  数据中心应根据服务商提供的服务水平协议考评服务商的服务质量,有必要时还可以听取客户对相关服务的满意情况,从而对服务商的服务进行评估。  服务商的考评结果应作为服务商续签合同、是否继续履行合同的依据,也可以作为督促服务商持续改进的依据。  4)服务商的合作关系管理  服务商的服务质量对数据中心的服务质量有着很大的影响。所以与服务商良好合作,共创共赢局面显得尤为重要。为能建立并巩固数据中心与服务商之间的关系,需要数据中心将一些服务机会研讨、服务质量评估等工作纳入到日常的服务商管理流程当中。6.2.4.运维管理的信息化要求  对数据中心运维管理产品的要求始于对数据中心信息系统的总体规划。这种规划无论大小、深浅都应始终坚持从数据中心的运维战略、业务需求、风险控制、成本效益等目标出发,同时还应清醒地认识到两个常见的决策误区:一是认为采用了高端的运维管理产品就代表了高质量的运维水平。对于这一认识毋庸赘言,从上述对人员、流程、合作伙伴的要求就可以看出,产品仅是一个方面而不能代表全部;另一个误区是不重视运维管理信息系统的建设,认为在信息系统建设上的投入不能带来直接的价值。对此,从专业化的数据中心运维角度来看,数据中心信息化能够实实在在带来的好处可以简单概括为以下几个方面:  (1)提高效率、降低成本。一个运维管理产品的投入使用往往可以带来十几倍以上的生产力提升和相应的成本降低。业界的普遍看法是:运维管理信息系统其实就是数据中心业务的生产系统。  (2)使运维风险保持在可以控制的水平。数据中心如果不重视对风险的控制就如同在高速公路上行车不系安全带一样危险,而危险一旦发生想继续行驶可就难上加难了。  (3)改进服务质量提升竞争力。数据中心的业务可以概括为:通过运行IT系统来向客户提供服务。没有信息系统的支撑来运行IT系统就如超市里仍然采用手工结账一样不能让顾客满意。  在随后的内容中,将针对数据中心运维管理产品中处于核心地位的监控管理产品(包括:基础设施监控产品和IT监控产品)和IT服务管理产品进行更进一步的介绍,而介绍的角度主要从选择的要素与系统部署架构出发。  1.基础设施监控管理系统  随着计算机技术的发展和普及,计算机系统数量与日俱增,其配套的环境设备也日益增多。数据中心机房已成为各大单位的重要组成部分。数据中心机房的环境设备(供配电、UPS、空调、消防、安防等)必须时时刻刻为计算机系统提供正常的运行环境。一旦数据中心机房环境设备出现故障,就会影响到计算机系统的运行,对数据传输、存储及系统运行的可靠性构成威胁,如事故严重又不能及时处理,就可能损坏IT设备,造成严重后果。  1)基础设施监控产品的选择要素  (1)技术先进性。  (2)系统高可靠性:系统硬件和软件均采用技术成熟的产品。  (3)系统运行管理方便:界面操作简单,技术支持能力强,承建单位技术实力强,服务完善。  (4)系统可扩展性能强:模块化结构有利于扩容与扩展。  (5)系统兼容性:支持世界厂家提供的智能设备,实现完美的监控。  (6)投资少:系统选型具有高性价比。  (7)建设时间短:在较短的时间内完成系统的安装调试。  2)基础环境监控管理系统部署模式  针对基础环境监控的部署一般采用采集处理、传输数据、监控展现和管理三层模式。下面以多数据中心基础环境监控管理为例说明,如图6-12所示。图6-12数据中心机房基础设施监控管理  (1)数据采集和处理:各数据中心通过对基础环境和设施的数据采集与处理在本地实现监控。  (2)传输层:各数据中心通过传输层将采集和处理的数据传送到需要的管理中心,如果是接入到Internet网络必须通过防火墙进行网络设定。  (3)监控展现和管理:通过传输层,将数据中心采集和处理的基础设施的监控指标进行集中管理,生成报表和报警。  2.IT系统监控管理系统  为了满足企业对IT服务要求的不断提高,不仅在可用性上,同时也要在资源利用率、可扩展性、容量管理等方面满足用户需求。数据中心应建立能对操作系统、应用系统和网络状况等进行故障监测和性能管理的监测系统。  通过此类系统,一方面可以对数据中心的服务器及其应用进行实时监测,另一方面也可以为系统管理人员提供完善的监测和报警平台以及可用性、容量管理的实时报告。最终能帮助系统管理人员快速定位并查找故障根源,有效降低由于服务器应用系统发生故障或失败而导致的风险,提高数据中心运维的服务质量,保证数据中心的服务器及其应用能7&24持续正常、稳定的运行,并根据客户需求的不同,提供5&8、7&12的分级服务。  1)IT系统监控产品的选择要素  虽然业界有许多满足此类需求的解决方案,但是如何才能找到一套符合企业运营管理特点的IT系统监控产品呢?在此,可以从以下几个方面评估产品功能,包括:  (1)能否满足跨操作系统、远程监测管理的要求;  (2)能否实现对服务器、网络设备、数据库、中间件、甚至应用系统的监测;  (3)能否实现远程报警等多种报警方式;  (4)能否提供丰富的报告、资源统计、分析等;  (5)在进行数据采集时能否支持代理与无代理相结合的方式;  (6)是否具备方便实用的用户管理功能;  (7)能否提供开放的API接口;  (8)是否能够保障监控的安全性。  2)IT系统监控管理系统部署模式  IT监控系统的部署模式一般分成被监控层、采集层、数据处理层、服务展现层、服务管理层。IT监控系统部署模式如图6-13所示。  (1)被监控层:被IT监控系统监控的对象,如网络设备、系统资源、应用资源、数据库资源。  (2)数据采集层:根据需求采集监控对象的资源数据,并进行规则设定。  (3)数据处理层:根据需要对采集的数据做进一步处理、保障数据的完整性,对数据进行选择性存储。  (4)监控服务展现层:将IT监控系统处理后的结果,展现给运维管理人员和关注IT资源的相关人员。  (5)服务管理层:与服务管理的API接口,将展现的故障、问题,以服务管理的方式进入服务管理系统,实现由事件到服务的转换。  3.IT服务管理系统  作为一个数据中心,如何管理各项与IT运维直接相关的工作,如何让这些工作遵循一些国际最佳实践,如何提升IT运维过程中的工作效率与知识积累能力,部署一套符合ITIL标准ITSM工具平台,并在其上建立配置管理数据库和知识库,无疑是一个相对比较成熟解决方案。通过这样的IT服务管理平台,可以帮助数据中心以&服务&的方式进行信息技术管理,很好地解决流程、人员、技术之间的关系。  1)IT服务管理产品选择原则  IT服务管理系统的建设实践证明:无论是对内还是对外提供服务,无论是单一的数据中心还是多地域分布的数据中心,选择产品时都应在遵循&集中建设、统一管理&的总体原则基础上,保证系统建设具有系统性、实用性、高效性、可扩展性,以及技术上的先进性、规范性和安全性。具体来说,所选择的产品应能满足以下建设原则要求:  (1)应建立集中的统一服务管理平台,对流程服务质量、运行状况、工作流程等实现实时监控、集中管理。  (2)对于为流程管理直接服务的基础信息,应采用统一规划、统一标准、统一控制的方式建设。  (3)实用性和高效性原则。  (4)安全性原则:应体现在拥有完善的身份认证和授权,具有数据备份、应急处理与灾难恢复等技术措施,具备完善的包含&用户、角色、对象、动作、许可证&的权限策略库。  (5)可灵活定制原则:从技术架构、数据和应用架构方面等方面均能适应后续的定制要求。  (6)高扩展性原则:既要满足现有和近期的性能要求,又要具备平滑扩展系统性能的能力。  (7)易于集成原则:能够与IT监控系统、基础设施监控系统、消息通知系统、移动应用系统、集中报表系统、ERP系统、门户等进行集成。  (8)灵活的报表技术:能提供统一化又能体现个性化的报表功能。  (9)便于&统一规划、分步实施&:选择的产品应具有模块化逐步集成的能力。  (10)产品厂商应具有强大的实力。  2)IT服务管理系统逻辑结构  IT服务管理系统逻辑结构如图6-14所示。图6-14 IT服务管理系统逻辑结构  3)IT服务管理系统部署模式  IT服务管理系统的部署模式多种多样,取决于数据中心的业务发展战略和技术实现。图6-15为多数据中心IT服务管理系统部署。图6-15 IT服务管理系统部署
键盘也能翻页,试试“← →”键
服务器论坛帖子排行
最新资讯离线随时看
聊天吐槽赢奖品}

我要回帖

更多关于 360度运维管理体系 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信