设为首页 | 收藏本站 | 关于我们 | 广告服务
 
 
当前位置:首页 > 科技资讯 > 工行金融科技研究院
工行金融科技研究院
工行陈庆:工商银行数据中心机房基础设施智能化运维实践
来源:中国金融电脑  作者:中国工商银行数据中心基础技术实验室 陈庆  日期:2022/5/17

摘要:本文结合工商银行数据中心在机房基础设施智能化运维的相关实践,研究了机房智能巡检机器人、设备资产定位等技术在应用时的关注点,重点强调了系统对接与数据交互的重要性,并对技术领域内基于AI 降低能耗的技术应用、数据中心基础设施管理平台建设等进行了展望。

  近年来,秉承工商银行“科技引领、价值创造”的工作思路,工商银行基础技术实验室自成立之初即将“绿色”和“智能”作为创新主题,在机房基础设施领域始终坚持“节能”与“智能”双效并重。然而,机房基础设施智能化运维作为专业知识、运维场景知识、人工智能等新技术知识三者交叉的综合性领域,对智能化成果的研发与应用均提出了极高要求。实践中,工商银行基础技术实验室以实际场景为切入点,从重复性较高、人力投入较大的工作入手,将物联网、人工智能等新技术与运维场景匹配,先后完成了机房智能巡检机器人、设备资产定位等技术的试点研究,并拟将新技术逐步推广至其他智能化运维场景。

  一、机房智能巡检机器人应用难点及经验总结

  工商银行基础技术实验室从2017 年开始研究机房智能巡检机器人,并于2019 年年底成功将一台根据数据中心需求定制的机房巡检机器人部署于工商银行数据中心嘉定园区,如今该巡检机器人已正式投产运行,同时逐步在工商银行多家一级分行的机房中推广使用。总体而言,机房智能巡检机器人可替代人工进行重复性的现场巡检工作,借助高清工业相机,透过机柜网孔门对机柜内的服务器设备、网络设备的状态灯进行识别。此外,机房智能巡检机器人也可看作是多种传感器的移动综合体,可用于采集机房温湿度、洁净度以及机柜红外热成像、机房噪声等环境参数,并将上述机房环境参数进行大数据分析。结合实践经验来看,尽管机房智能巡检机器人是业界关注的热点应用,但后续应用仍面临以下难点。

  一是机房智能巡检机器人的应用场景较少。随着远程监控手段的不断完善,数据中心对服务器设备进行现场巡检的必要性越来越低,未来人工巡检可能更多被作为远程监控的有效补充。后续, 面对各种制度性的现场巡检要求,机房智能巡检机器人的应用场景仍有待进一步挖掘和丰富。

  二是机房智能巡检机器人的应用可能增加新的运维工作量。由于机房智能巡检机器人尚不成熟,现阶段应用可能需要投入更多的人力去负责机器人运维。目前来看,机器人的智能化程度与预期设想还存在较大差距,其工作逻辑基本上也是以事先预设状态的比对为主,因此在机器人实现“智能”之前,仍需要有大量的人工示教工作和调优工作。此外,银行同业在引入机房巡检机器人时,还应特别注重机器人的“自学习”能力,即应引入可基于人工智能技术对设备状态灯、机房环境、设备资产等特征进行学习的机器人,尽量避免引入需要做大量人工预设工作的“傻瓜式”巡检机器人。

  三是机房智能巡检机器人的应用需结合设备资产信息实现智能化采集,即机房巡检机器人在发现异常状态灯变化后,进行故障报警时,报警信息应包括设备资产信息。设备资产信息主要包括设备安装位置、品牌和型号、设备序列号或者资产编码等。若没有应用设备资产信息智能化采集技术,需要人工维护设备资产信息,易导致因设备位置发生变化时资产信息更新不及时而影响巡检机器人的使用。

  四是数据中心应用机器人的终极目标应是智能运维机器人,包括完成服务器上下架、更换硬盘和电源模块等简单动作。截至目前,工商银行基础技术实验室虽然已经开展相关研究工作,但是距离实现这一目标还有很长的路要走。首先是可应用于运维操作的机械手技术尚不成熟,且大多价格昂贵;其次是机房模块、机柜、服务器设备的标准化程度不高,难以实现统一操作。对此,工商银行基础技术实验室拟继续加大机房、机柜、服务器设备的标准化工作,并尽快启动取消机柜网孔门的论证工作,力争在节约投资的同时加快智能机器人等新技术的研发应用。

工商银行机房智能巡检机器人

  除机房智能巡检机器人外,工商银行基础技术实验室从2019 年下半年开始研究在数据中心配电间部署动力巡检机器人。相对而言,吊轨式动力巡检机器人是一项比较成熟的技术,已经在电力行业应用多年,但应用于数据中心配电间的案例非常少。鉴于动力配电间的人工现场巡检需求在未来一段时间将长期存在,因此动力巡检机器人的成功应用将大幅减少人力投入。

  同时,目前业界正在研究园区安保巡检机器人、巡检无人机等应用。但笔者通过调研发现,业界使用安保巡检机器人、巡检无人机实现的主要功能是车辆车牌识别、非法进入人员人脸识别,而数据中心通常为封闭式管理,进入园区的车辆和人员均需经过严格的安检,并不存在此类应用场景。此外,安保人员在进行园区人工巡检时如果发现非法入侵、消防隐患等不安全因素,会立即采取措施消除隐患,但园区巡检机器人、巡检无人机只能发现隐患,却无法立即消除隐患,故笔者认为此类技术尚无法替代人工巡检。

  二、设备资产定位技术应用实践

  一般而言,设备资产定位技术是指对机房内安装的机柜服务器、塔式设备、仓库在库设备等进行定位的技术,不仅可以提高数据中心硬件设备资产管理的精细化水平,减少人工盘点的人力资源投入,还是智能巡检机器人等依赖资产数据的智能化运维技术的基础。现阶段,该技术的主要难点是机柜服务器在垂直空间上精确到U位级别的定位,但目前市场上主流的接触式有线定位方式大多需要人工进行标签和定位器连接,反而增加了日常运维工作量。对此,工商银行基础技术实验室通过技术调研,选择了非接触式的无线定位方式,并引入了定制化产品进行试点。通过试点发现,该技术可以实现机柜服务器设备的U 位级定位,且定位精度准确,同时无线信号不会影响计算机设备的正常运行。当然,目前的无线定位技术由于使用了有源电子标签,还需要进一步改进,包括延长有源标签的电池使用寿命或优化标签取电方式等。此外,该项技术的推广也离不开服务器厂商、机柜厂商的大力支持,需要将定位标签作为服务器出厂配置,而基于服务器出厂时携带的定位标签,可集成客户特有的资产编码,从而避免后期录入和匹配,大大减少运维的人力投入。

资产定位标签和定位控制器

  与此同时,为尽可能将智能化运维场景融入已有的科技管理系统中,工商银行基础技术实验室在应用设备资产定位技术以及机房智能巡检机器人的相关试点中,均极为重视数据交互。否则,新引入的运维系统不仅将增加已有的运维工作量,且由于使用习惯等原因,还可能导致其长时间不被运维人员使用乃至最终被抛弃。为避免上述问题,工商银行基础技术实验室针对设备资产定位系统实现了与工商银行已有资产管理系统的对接,并在机房智能巡检机器人试点中,实现了机器人系统与工商银行无线网络安全认证系统、资产管理系统、门禁系统、集中监控系统等已有科技管理系统的有效对接。

  三、后续关注重点

  1. 加强AI 在降低能耗方面的应用

  基于AI 技术降低能耗的基本原理是基于目前流行的深度学习方法,建立可影响数据中心电能使用效率指标PUE 值的人工神经网络模型,进而在线优化调整数据中心制冷系统的各控制因子。该项技术由谷歌在2016年首次通过论文方式公开,国内多家厂商如今已经形成了较为成熟的解决方案和软件产品,并开始在数据中心进行应用。同时,AI 技术在基础设施领域还可以应用于设备故障预测、设备生命周期评估、基于容器调度的机房节能技术等,但上述研究大多还处于起步阶段,尚未出现成功的实施案例。除此之外,使用风能、太阳能等可再生能源同样是建设绿色数据中心的重要方法和必然趋势,而鉴于多地多中心已成为数据中心的主流架构,如何根据多数据中心的IT 负载需求,动态、高效、安全地使用可再生能源来提升节能水平,也将是工商银行基础技术实验室未来的研究方向之一。

  2. 完善数据中心基础设施管理平台建设

  数据中心基础设施管理平台(DCIM)本质上是基础设施集中监控平台的升级版本,旨在赋予监控平台更多的自动化和智能化功能。近年来,工商银行结合上海两个园区建设已经开展了多轮DCIM 实践,但一个全新的DCIM 平台将在很大程度上改变已有的运维流程和习惯,要被一线运维人员接受仍需要经历一个过程。结合实际经验来看,DCIM 建设不仅在需求讨论阶段需要生产一线运维人员的深度参与,同时在投产运维阶段也需要进一步根据使用情况进行优化改进。对此,建议同业在一个相对稳定的框架下提出新的功能点需求,逐步改进和完善已有的DCIM 平台,而不是重新建设。

  3. 办公自动化与人才培养

  日常运维数据自动采集和统计处理、报表和报告的自动生成虽与智能化无关,但仍是目前数据中心基础设施生产运维的重要需求。对此,建议同业在需求评估的基础上对现有的科技管理系统增加必要的功能点,而不是单独进行新系统的开发。此外,在人才培养方面,考虑机房基础设施运维人员以供配电和制冷等硬件专业背景为主,对人工智能算法、软件等了解较少,因此建议同业数据中心可着重培养部分既了解基础设施硬件运维知识又了解人工智能算法、软件编程的技术骨干,以更好地挖掘和实现智能化运维场景。

  综上所述,数据中心设备及机房基础设施智能化运维水平的提高是一个持续的过程,对于该领域的研发人员来说,最重要的是发挥运维背景优势进行场景挖掘,将需要解决的问题进行定义和描述,同时持续关注物联网、机器人、人工智能等新技术的演进趋势,不断尝试开展技术与场景的应用匹配。

 
 
企业简介 | 版权声明 | 免责声明 | 频道介绍 | 安全提示 | 法律顾问 | 网上投稿 | 客服电话 | RSS订阅
Copyright © 2005 Fcc.Com.Cn, All Rights Reserved. ,《中国金融电脑》杂志社版权所有
电话:010-51915111-805 传真:010-51915236,网络出版服务许可证(署)网出证(京)字第337号
京ICP备14024077号-1 京公安网备:11010802025321 技术支持:站多多