新闻动态
疫情下的数据中心新运维
2020-03-132020年是一个特殊的年份,不仅因为今年是“十三五”规划的收官之年,还因为今年的春节过得有些艰难。2020,对数据中心运维意味着什么?
2020,从十三五规划看数据中心发展
2020年是“十三五”规划的收官之年,同时也是“十四五”规划的开局之年,是实现“中国制造2025”的重要支点之年。过去的五年间,我们见证了数字经济的飞速发展,见证了以5G、物联网、人工智能、云计算为代表的新一代信息技术的快速迭代和应用,也见证了作为数字和信息应用基础设施的数据中心的快速发展。
过去的五年间,数据中心无论从总体规模还是个体规模上均发生了翻天覆地的变化,数据中心运维市场也随之快速发展。
“2021年中国IDC业务市场总规划接近3000亿元,以30%的年增长速度快速发展。“
-----科智咨询
“2020年中国数据中心运维服务市场规模将达到2744.7亿元。这个乐观的预测基于我国互联网数据中心的快速发展。”
-----艾瑞咨询
由此可见,不断壮大的业务要求对基础设施运维工作提供了愈发严峻的挑战。那么,在2020年这个特殊的时点,我们不禁要问,数据中心基础设施运维未来路在何方?
2020,从新冠疫情看数据中心运维痛点
2020年也是不平凡的一年,由于新冠疫情,这个春节大部分人都是在家中度过的。为抗疫情,人们有责任和义务待在家中,但生活和工作不能停滞。由此我们见证了以线上教育、远程会议、网络购物为代表的一系列线上业务的井喷式爆发, “钉钉”成为了日活2亿的“网红”软件。在这些线上应用爆发的背后有大量数据中心运维人员的无声付出。许多数据中心运维团队即使连轴转也很难满足爆发式增长的业务要求。同时,运维团队的现场工作也面临着巨大的感染风险。由此,传统运维方式已不足于适应突发形势的要求,其运维模式的痛点在这次新冠疫情中被放大。
传统运维模式完全以人为核心,所有运维工作皆依赖于人,运维人员即是数据中心能力的瓶颈,也是矛盾的集中点。随着数据中心业务的增长,规模也越来越大,飞速发展的业务使数据中心传统运维模式的痛点愈发突出:
(1)数据中心维护巡检工作量大且重要
在数据中心运维场景中需要进行日常设备巡检的作业中,当巡检人员面对数量较大的设备时,如果需要运维人员根据流程判断每台设备工作状态,重复性的检测工作会让运维人员产生疲劳,实际情况经常出现敷衍了事。
(2)数据中心人员要求高
据BANYANO机构调研统计,超过半数的数据中心管理者认为人员数量不够和人员资质不够是故障和事件发生的原因,而仅18%的数据中心认为自己运维人员配置充分满足要求。由此可见数据中心人员要求高和高素质运维人才供给不足这对矛盾必将长期存在。
(3)数据中心传统运维模式存在隐患
传统运维监控基于数据中心动环系统和人员巡检,而无论是动环系统还是人员巡检,所采集的均为粗颗粒度数据,无法做到精细化数据的采集。这既有历史建设原因,也有成本考虑,因此传统运维模式存在的隐患将长期存在。
(4)数据中心缺乏远程管理现场的能力
数据中心缺乏远程管理现场的能力,所有的监控和决策均须运维人员在现场做出,即使有管理系统支持,但对于异常的表现细节仍需运维人员到现场确认,若运维人员无法短时间内到达现场(如本次新冠疫情),则无法快速排除异常和故障,进而影响服务可用性。
2020,龙控智能运维机器人重构传统运维模式
基于上述背景和传统运维模式痛点,“无人化”已成为数据中心运维关注的核心趋势之一。无人化并非不需要运维团队,而是构建以“人+智能”为理念的全新人机协同模式,使得人力、物力、时间等宝贵资源得到充分利用。
随着数据中心运维无人化趋势日趋显著,无人化运维产品和方案也逐步推向市场,而由我司推出的以智能运维机器人(以下下简称,龙控机器人)为核心的数据中心基础设施无人化运维方案是其中较为成熟并有落地应用的智慧解决方案。
(1) 7*24小时自动运行,提供全时域运维服务
数据中心传统运维模式为保证7*24小时运维覆盖,采用倒班制应对,连续的倒班会使人精神疲惫,不仅耗费大量的人力,并且不利于保证团队长期的战斗能力。
龙控机器人采用先进SLAM激光+多维超声雷达融合定位导航技术,无需任何机房改造,即可完成运维区域的电子地图构建,实现精确定位、自主导航、路径规划,无需任何人工操作;支持自主壁障功能,遇到障碍物机器人可自动感知,重新规划运行路线,继续完成运维工作;先进的电池管理技术支撑机器人实现超长时间巡航和低电量自主充电,为数据中心提供7*24小时全时域自动运维服务,在大大减少人力投入的基础上,提升运维效益。
(2)由受限空间向立体全空间扩展
数据中心传统运维模式通过现场巡检方式巡查数据中心运行状况,这种方式受限于人的物理限制,对于人无法触及到的地方无法巡检(如高空线缆槽、管路),实现的是非真正全空间的巡检活动,在未触及的空间留有故障隐患。
龙控机器人采用行业首创的“双升降”设计,实现了数据中心0~2.8m立体空间的多维度、多层次感知、采集和分析,将运维区域从受限空间扩展到立体全空间,从机柜、设备扩展到线缆槽、管路,从而可监控更广的空间区域,避免了以往传统人工运维的一些管理死角。
(3) 智能巡检提升数据中心可用性
传统数据中心运维模式依赖于人的经验判断,面对大量复杂且类型众多的数据中心基础设施,运维人员往往无法避免判断失误。另外,往往运维人员所巡检的位置和维度较为固定,所收集的数据颗粒度较粗,所收集的数据维度较少(如无法留存现场图像),数据准确性存疑,不能精细化地保证数据中心完全可控,出了问题,也不易追溯。
龙控机器人融合“智能物联技术+AI视觉识别+多维感知”,支持对数据中心设备、环境、状态的自动感知、自动采集、自动识别、自动告警,实现对机房设备及环境状态的全覆盖,把控机房真实状态,大大降低了误检、漏检风险,提升了数据中心可用性。
(4)远程控制实现运维人地分离,打破运维空间限制
传统运维模式下现场确认必须由运维人员现场完成,当遇到突发事件,如机房发生有害气体泄露,运维人员不适合第一时间进入机房进行现场确认,这会造成事件无法得到第一时间确认,从而影响故障的快速排除,影响可用性提供。
龙控机器人支持集群管理和远程控制,运维人员可在中控中心或者任何一个可以接入机器人管理平台网络的地方对网络内的任意一台机器人进行远程控制,第一时间获取现场真实情景,为及时排除问题提供有力支持。
未来,数据中心“人+智能”将成为常态
未来,我们可以想见,数据中心中“人+智能”,人机协同必将成为常态,人与机器人必将和谐共生,机器人将在更大的程度上减少人的劳动,最终向真正意义上的无人化运维迈进。这是历史的大潮,在这个大潮中,必将涌现出许多明星企业,而作为深耕数据中心行业二十余年的我们也会与众多合作伙伴一起携手共进,不忘初心,方得始终。