来源:玉工讲技术
1)运维管理基本规律
数据中心基础设施虽然看似庞大而复杂,但就运维而言没有特别深奥和无法理解的疑难技术,重点还是实践实践再实践;
一个实践经验丰富,动手能力强的工程师可以顶替几个人工作量,关键看有没有责任心、专研和团队精神;
认真履行巡检和定期演练,就像“量子力学引入的双缝干涉实验”所描述一样,设备正常运行也许会受到这些看不见“量子”等未知因素的影响;
高质量的应急文档可以弥补人数不够或缺AB角色等(即人员2N或N+1架构)问题,在文档建设方面分配足够的时间、人力、精力还是值得的。
2)运维管理基本原则
一切以服务协议级别(Service Level Agreement)为主从实际出发原则;
定期梳理机房内IT设备、管理好其生命周期,及时对其进行下电(拔掉设备电源线)或整改原则;
安全可靠经济性之间找到最佳平衡点原则;
善用工具并充分挖掘辅助设施所采集数据价值的原则;
善待运维人员,不要把电工暖通工看成脏活粗活儿原则。
图2 多个机房覆盖内容信息清单
图3 基础运维初期自建团队织架构图
图4 基础设施运维三组六人动态倒班制
图5 基础运维混合扁平化织架构图
0人已收藏
0人已打赏
免费1人已点赞
分享
电气资料库
返回版块70.13 万条内容 · 752 人订阅
阅读下一篇
数据中心基础设施运维管理模型(2)来源:玉工讲技术上一篇我们强调数据中心运维要做“减法”时,关键点在于我们对运维管理模 型的 正确认识。除了了解运维管理模型,还需了解数据中心几个关键参数。在《 云数据中心的四层架构 》文章里曾经描述过数据中心的构成(适合于初学者),但作为入门者,我们需要了解数据中心的供电回路数量、机柜数量、变压器数量、冷水机组数量、冷却塔数量、柴油发电机数量、UPS数量、蓄电池数量、末端精密空调数量数量等等。因为这些数量的不同,意味着需要不同的工作量,借助这些数量我们能够更准确评估需要构建什么样的团队,配置多少个人等。因为运维人员需要应对各种紧急情况,如应急发电、
回帖成功
经验值 +10
全部回复(0 )
只看楼主 我来说两句抢沙发