中国工商银行数据中心总经理 王雍
在以大模型为代表的新一代人工智能带来新的行业变革之际,中国算力产业正加速迈向万亿级规模。在这场由大模型技术驱动的智能跃迁中,工商银行数据中心率先突破传统数据中心框架,以“AI原生”思维升级金融算力基础设施。智算中心已超越单纯算力供给范畴,演变为支撑智慧金融生态的核心中枢,驱动金融业态向认知智能阶段跃升。面对异构算力整合、绿色低碳发展、全栈自主可控等攻坚课题,工商银行数据中心全力打造运营效率高、抗风险能力强、具有全面布局能力的强大智算基础设施,以算力基础设施高质量发展支撑工商银行金融业务数字化转型,为金融行业探索出一条AI时代下的算力基础设施升级路径。
一、架构升维:构建AI原生型智算中心的算力底座
在大模型驱动的人工智能浪潮中,传统数据中心正经历从“通用算力”向“AI原生智算”的深刻转型。这一转型不仅涉及硬件架构的重构,还需通过大模型算力底座的系统性升维,支撑大模型训练与推理的复杂需求,实现算力资源的高效调度与智能化管理。工商银行数据中心紧跟业界发展趋势,深入开展AI算力芯片、服务器、存储、网络以及机房基础设施的转型实践,以全栈重构突破传统数据中心算力瓶颈,构建支撑千亿级参数模型的AI原生算力底座,实现模型训练效率和算力资源利用率的显著提升,助力智慧金融业务创新发展。
创新性突破技术封锁,实现算力基础设施自主可控转型。当前,大模型对算力的需求呈现指数级增长,传统以CPU为中心的架构已无法满足需求。新一代智算中心需构建以AI芯片为核心的异构计算体系,通过“CPU+AI加速卡”的协同设计提升算力密度,AI芯片的自主可控替代成为关键趋势。工商银行数据中心创新突破多项人工智能技术瓶颈,实现AI芯片、高性能算力网络、高性能存储设备、AI服务器、训练框架等全栈自主可控的AI算力基础设施建设,建成可支撑千亿级参数训练的大规模分布式AI算力集群。
突破性应用关键技术,实现异构资源的统一纳管与智能调度。大模型的训练和推理需要大规模算力的弹性供给,而传统算力中心存在资源分布不均、利用率低等问题,无法满足上述需求。通过算网融合与云原生技术应用,智算中心可构建跨地域的算力网络,实现资源的动态调度。工商银行数据中心围绕高性能网络智能无损传输和分布式AI算力集群建设等场景,突破智能无损网络技术、死锁避免技术、跨节点高速互联技术、动态负载均衡技术、算网协同、分层存储架构等关键难点,满足人工智能集群高速互联零丢包、低时延、高吞吐量的需求,并将RoCE算力网络纳入云网一体化管理,实现AI计算资源、网络资源的统一调度和运维管理。
技术架构升维的本质是通过“硬件创新+软件定义+生态协同”的三重突破,构建适应大模型时代的AI原生底座。未来,随着存算一体、光电子通信等技术的成熟,智算中心将逐步摆脱对单一芯片的依赖,转向更灵活、高效的全栈智能架构;自主可控与开放生态的共建,将成为架构升维进程中的关键点。
二、绿色跃迁:破解金融智算中心的绿色低碳实践密码
在数字经济时代,算力基础设施已成为驱动金融业转型的核心引擎。工商银行数据中心以前瞻性视角紧跟国家“双碳”战略目标,以人工智能技术为支点,推动数据中心向智算中心的全新跃迁,重构金融基础设施的可持续发展逻辑,为行业破解低碳转型难题并提供创新范式。面对“双碳”目标与数字经济浪潮的双重挑战,工商银行数据中心将绿色理念贯穿于规划、建设、运营的全生命周期,构建覆盖技术、管理、生态的立体化碳中和演进实践体系。
颠覆性革新技术架构,开创性地将绿色基因植入基础设施的规划蓝图。工商银行数据中心打破传统数据中心“先建设、后改造”的路径依赖,在规划阶段即预设绿色进化空间。以国家A级机房标准为基准,应用液冷、自然冷却、UPS模块休眠、智能照明系统等创新技术产品,建立全方位环境监控体系,并构建逐年递减的电能使用效率(PUE)指标管理机制,实施精益化能源管理,形成可量化、可追踪、可改进的绿色运营闭环。基于此,工商银行数据中心嘉定园区获评首批“国家绿色数据中心”,成为行业能效标杆。
前瞻性谋划战略布局,多中心建设协同响应“东数西算”战略。绿色数据中心不是孤立的技术孤岛,而是需要构建与区域能源结构、业务需求特征、技术演进趋势相协同的生态体系。工商银行数据中心通过统筹数字基建布局,以“现有园区改扩建+新建数据中心园区”双轮驱动,将绿色技术应用与高可用性、灵活扩容能力深度融合,打造兼顾当下需求与未来发展的跨地域、多层次的新型绿色算力网络,以系统化思维突破单一数据中心节能改造的局限,实现绿色实践与区域能源结构、技术趋势深度融合,为行业提供可复制的转型路径。
工商银行数据中心以顶层设计的系统性、技术创新的颠覆性、生态构建的开放性,实现了算力基础设施的绿色跃迁,为金融业低碳转型树立标杆;同时,积极做好技术输出与标准引领,参与编制《金融业绿色数据中心白皮书》《金融数据中心能力建设指引》等标准体系,将单个企业的绿色实践转化为整个行业的转型动能,推动全行业形成可持续发展合力,彰显数字经济时代金融机构的责任担当。
三、数智孪生:以AIOps重构金融级智算运维范式
在金融业数字化转型加速与算力规模爆发式增长的背景下,以人工经验为驱动的传统运维模式已难以保障超大规模智算中心的高效稳定运行。工商银行数据中心以智能运维为抓手,积极探索应用大数据及人工智能等技术,通过“数据驱动+算法赋能+场景闭环”的协同创新,建设与行内分布式IT架构和数据中心长远布局相适配的一体化智算运维体系,持续保持生产运维能力业界领先。
全局性打通运维链路,打造全生命周期智能化运营体系。工商银行数据中心加快推进IT运营管理由“人力密集型”向“技术密集型”演进,打破“竖井式”管理模式,强化各领域协同运维。一是通过健全监控体系,推进监控架构升级、加固业务视角监控、夯实智能分析基础,持续优化数智融合的监控体系,实现监控效率提升、业务变化可观测、全局可感知;二是增强变更风险防御能力,聚焦变更风险把控,紧密结合应用架构、技术架构演进,强化变更风险防御平台的支撑能力,实现变更方案自动生成及效果推演,提升变更事前、事中及事后全流程风险控制能力;三是搭建自研混沌工程平台,以主动注入故障方式识别和修复未知隐患,持续提升系统稳定性;四是推进FinOps建设,通过增强资源使用可观测能力,构建覆盖资源“申请—分配—洞察—治理”的全生命周期数字化运营能力,实现算力资源精细化管理和快速扩缩。
持续强化科技赋能,推动运维服务能力工具化、自动化和智能化建设。技术创新是促进金融服务新模式和新业态产生的关键动力,也是发展金融新质生产力的核心要素。工商银行数据中心充分发挥数据技术赋能优势,深化科技与业务融合,培育数字金融新质生产力。一方面建设运维数据分析引擎和动态运维数字地图,提供智能算法及数据服务,在云环境的故障发现、诊断定位及性能容量趋势分析等场景发挥实效,创新成果“云原生智能运维建设项目”获得中国信息通信研究院智能化运维(AIOps)能力成熟度评估3级认证;另一方面积极探索AI大模型技术在数据中心运维领域的应用,推进DeepSeek等大模型的分析推理能力与运维RAG知识库、智能运维小模型、运维工具的贯通,研发建设运维智能体,在运维知识问答、运维数据分析等场景试点落地,提升科技创新赋能运维智能化转型的成效。
经过20多年的发展,工商银行数据中心的自动化运维水平已初步达到有条件运行自动化(L3)阶段,正朝着高度运行自动化(L4)阶段阔步前行。未来,工商银行数据中心将持续加大AIOps的创新研究及落地转化推广力度,进一步推动资产管控、生产运行、安全防护等领域管理向全生命周期数字化、网络化和智能化转型,构建极简高效、人机协同的“AI+”数据中心。
立于大模型技术革命与数字中国建设的交汇点,工商银行数据中心正以“金融业新型算力”领航者姿态,打造支撑万亿级经济体的金融级智能算力平台和网络。未来,工商银行数据中心将以数字新基建主力军的担当,持续深化“算力—算法—数据”三维融合创新体系,在金融业首个全栈自主可控的千亿级人工智能算力集群的攻坚实践中,筑牢金融业数字智能底座,在服务国家经济高质量发展和金融强国建设中开拓智能算力新蓝海,为构建新发展格局注入生生不息的金融算力动能。
|