云计算数据中心该如何维护

日期:2017-07-26      来源:otpub.com      作者:otpub      编辑:灵枫      点击:312次

云计算

由于云计算具有灵活快速扩展、降低运维成本、自动化资源监控等特性,除基于ITIL的常规数据中心运维管理理念之外,还需要注意以下运维管理方面的内容。

理清云计算数据中心的运维对象

数据中心的运维管理指的是与数据中心信息服务相关管理工作的总称。云计算数据中心运维对象共可分成5类:

机房环境基础设施

主要指为保障数据中心所管理设备正常运行所必需的网络通信、电力资源、环境资源等。

IT服务设备

包括存储、服务器、网络设备、安全设备等硬件资源。

系统与数据

包括操作系统、数据库、中间件、应用程序等软件资源;还有业务数据、配置文件、日志等各类数据。

管理工具

包括了基础设施监控软件、监控软件、工作流管理平台、报表平台、短信平台等。

运维工作人员

包括了数据中心的技术人员、运维人员、管理人员以及提供服务的厂商人员。

建立信息化的运维管理平台系统

云计算数据中心的运维管理应从数据中心的日常监控入手,事件管理、变更管理、应急预案管理等方面全方位地进行数据中心的日常监控。实现提前发现问题、消除隐患,首先要有完整的、全方位实时有效的监控系统,并着重监控数据的记录和技术分析。信息化的数据中心运维管理平台系统包括如下方面:

1、机房环境基础设施监控管理系统

2、IT系统监控管理系统

3、IT服务管理系统

自动化管理

IT服务根据负载变化可以自动调整所需资源,以求在及时响应和节约成本上取得平衡;同时,计算能力规模越来越大,人工管理资源也越来越不实际。这些新特性对IT管理自动化能力提出了更高要求,企业往往希望在不失灵活性的前提下可以得到更高程度的自动化。

为此,云计算数据中心需要部署自动化管理平台,集中管理虚拟化和云计算平台、提供自定义规则定制功能的自动化解决方案,用户通过使用事件触发、数据监控触发等方式来自动化管理,节约人力同时提高响应速度。

应急预案管理

应急预案是为确保发生故障事件后,尽快消除紧急事件的不良影响,恢复业务的持续营运而制定的应急处理措施,其中包括:

1、根据业务影响分析的结果及故障场景的特点编写应急预案,确保当紧急事件发生后可维持业务正常运作。

2、应急预案除包括特定场景出现后各部门、第三方的责任与职责外,还应评估数据恢复所需要的时间。

3、应急预案必须经过演练,使相关责任人熟悉应急预案的内容。

数据中心作为信息与信息系统的物理载体,目前主要用于与IT相关的主机、网络、存储等设备和资源的存放、管理。只有运维管理好一个数据中心,才能发挥数据中心的作用,使之能更好地为云计算提供强大的支持能力。


编辑推荐:

1、无服务器计算给云计算埋了哪些隐患

2、云计算和传统IDC有什么区别

3、如何防范云计算面临的威胁

4、企业应该怎样建立云计算的架构体系

关键字:云计算

本站所载作品版权归作者及原出处共同所有。凡本网注明“来源:OTPUB”的所有作品、文章,版权均属于本站,转载、摘编或利用其它方式使用上述作品,应注明“来源:OTPUB” 或 “摘自:OTPUB”。

上一篇: 【直播预告】腾讯云化解安全危机... 下一篇: 应对工控网络安全威胁,首先要做...