设为首页 | 收藏本站 | 关于我们 | 广告服务
 
 
当前位置:首页 > 中国金融电脑 > 2025年6月
兴业银行智算中心的探索与进化之道

  

兴业银行数据中心总经理助理 陈曦

  人工智能浪潮奔涌而至,新质生产力迸发出澎湃动能,推动以“智”为核的科技革命拉开帷幕。面对新一代人工智能技术快速演进的新形势,“人工智能+”连续被写入政府工作报告,发展人工智能上升到战略高度。2025年4月25日,习近平总书记在主持二十届中共中央政治局第二十次集体学习时强调,以人工智能引领科研范式变革,加速各领域科技创新突破。作为中国金融业数字化转型的先行者,兴业银行积极探索“人工智能+”发展路径,推动智算中心建设,通过数字孪生筑基实现基础设施全生命周期管理与数据融合,以大模型赋能智能运维决策,在场景革新突破中重构运维管理能力,推动智算生态规范化演进;将人工智能技术深度融入运维各环节,构建安全、可靠、高效的智算中心体系,为书写科技金融、数字金融等“五篇大文章”提供坚实支撑。

  一、数字孪生筑基:创设虚实双生的智慧空间

  在金融科技与实体经济深度融合的浪潮中,银行业正从“流程驱动”迈向“数据驱动”的新阶段。兴业银行通过数字孪生技术连通物理世界与数字空间,不仅是对传统IT架构的重构,更为后续智能化运维、场景革新与生态构建奠定数字基础,开启虚实协同的智慧转型新篇章。

  1.全域数据融通,构建多模态感知数据湖

  在兴业银行智算中心数字孪生体系的搭建中,多维度、海量数据是智慧空间的核心支撑,历经数据汇聚、融合、建模三个阶段打造数据湖,以奠定虚实交互基础。在数据汇聚阶段,兴业银行构建了统一采集网络,获取数据中心环境数据、设备运行状态与应用系统信息;确保架构设计中多源系统的兼容,实现全对象、全流程覆盖,为后续处理提供动态完整的数据支撑。

  在数据融合阶段,兴业银行构建“物理实体—虚拟模型—标准规则—调优算法”四维互验体系,通过传感器与数字模型双向校验,消除空间映射偏差;融合业务规则与算法,基于多维数据交叉验证,提升数据关联度与一致性,为业务决策提供更精准的依据,提升系统响应效率。

  在数据建模阶段,兴业银行采用“单元建模—模型组装—跨域融合—迭代验证—模型校正”五阶体系构建动态演进的模型库,从单元建模起步,层层组装复杂系统模型,明确知识关联,实现跨技术领域协同优化;通过仿真验证提升模型精度,持续迭代升级,最终形成高保真的数字映射,为风险防控、资源配置等提供坚实支撑。

  2.虚实映射交互,锻造基础设施管理中枢

  兴业银行基于云原生底座构建数字孪生平台(如图1所示),通过IoT多模采集技术连通环境、软硬件设备,实现数据中心全要素秒级映射。该平台嵌入机器学习引擎,融合3D/VR技术构建360°全景监控视图,提升了故障预测的准确率。通过孪生体模拟设备全生命周期,数字孪生平台不仅提高了资产管理的效率,还使数据中心的整体PUE得以优化。

  

图1 兴业银行数字孪生平台架构

  3.数模交互淬炼,驱动运维质量提升

  兴业银行依托大模型平台,将数字孪生多元数据不断地投喂给模型,驱动大模型持续学习并不断完善运维知识库,同时从配置管理数据库(CMDB)中精准提取信息,结合容灾预案、故障场景知识,借助虚实双生模型,让大模型充分发挥其推理分析能力,在虚拟环境开展容灾与故障推演,提升运维质量。

  二、大模型赋能:构建全域智能运维中枢

  当数字孪生奠定数据基础后,大模型正成为智能运维的中枢神经。面对金融场景的复杂性与实时性要求,兴业银行以大模型为核心构建运维智能体平台(如图2所示),推动运维模式从被动响应向主动防御跃迁,为业务连续性构筑坚实的智能防线。

  

图2 兴业银行运维智能体平台架构

  1.智铸国产基座,实现垂直深耕

  兴业银行以国产大模型为核心技术引擎,深度融合Qwen、DeepSeek等大模型,以及BGE向量模型及多模态能力,通过云原生架构实现多卡并行计算与多节点协同部署,适配国产芯片生态,构建支持推理加速与弹性扩展的智能底座。针对运维场景特性,通过领域微调增强模型对设备拓扑、电力逻辑、软件架构等专业知识的理解能力,形成垂直化智能分析引擎;同时,为模型服务层提供异构算力适配与高效推理支持,实现自主可控模型集群部署。

  2.智聚多模态库,实现知识沉淀

  兴业银行积极整合运维全场景数据资源,包括设备和应用系统日志、技术手册、业务说明、历史故障案例等结构化与非结构化数据,构建多模态知识库;采用自然语言处理技术提取设备关联规则与操作规范,融合时序传感器数据构建健康检查体系,建成各技术领域知识库系统40余套;基于历史故障库训练诊断模型,结合主动学习机制,每日动态更新知识库,持续沉淀运维领域经验;实现数据知识层多模态数据熔炼,支持数据闭环反哺模型迭代,不断提升决策精准度。

  3.智联决策闭环,实现生态融合

  兴业银行积极打通智能模型与运维支撑系统的交互链路,通过API服务、Web组件等方式嵌入运维监控、巡检、变更、应急管理等核心场景;构建“感知—分析—执行”决策闭环,实时采集应用系统的设备运行状态数据,利用预测模型预判业务连续性风险,生成优化策略并自动下发至运维操作系统,实现人机协同的智能运维协作;完善平台能力层功能,实现智能交互快速定制、知识全域智慧管控、语义问答毫秒级响应、权限安全多维度保障,并高效集成总分行业务、管理决策、运维支撑等各类型系统。最终,兴业银行在应用服务层构建智能化场景应用,支持多类型接入方式,实现跨平台能力输出,达到日活跃用户1500多个、日均问答6000多次的应用成效。

  三、开启场景革新:驱动运维领域效能突破

  技术沉淀的最终目标是场景价值的释放。在传统运维面临效率瓶颈与风险敞口的当下,兴业银行依托数字孪生与大模型双轮驱动的技术沉淀,运用人工智能技术助力数据中心转型,探索节能智控如何通过动态能效模型降低资源消耗,多维监测如何构建“监测—预警—修复”智能防线,容灾推演如何以数字沙箱验证业务韧性,以及智驱运维如何通过自动化流水线释放人力潜能,实现智算中心从理论构建到实践价值创造的跨越。

  1.多维监测,打造智能预测体系

  兴业银行构建了覆盖从基础设施到业务层的立体化监测网络,打破传统运维被动响应的局面,实现主动预测与精准防控。

  全域日志智能巡检:实时采集硬件设备、基础软件、应用系统等不同层级的日志,通过大模型训练分析,实现日志模式的自动学习与异常检测,已支持20余类软硬件设施的智能巡检,提升巡检效率和问题识别率,使风险隐患识别时间缩短至5分钟以内。

  多维数据关联分析:通过跨系统整合多维度监控数据,有效消除数据孤岛现象,生成详细的系统画像和故障画像,显著提升了运维效率,使目标感知和定位时间均缩短30%。

  容量预测规划:基于各应用交易系统的业务量信息和历史数据,智能预测业务增长趋势及关键时间点的业务需求,结合资源消耗趋势,科学规划资源扩容和人员值守安排。目前,部署各类容量预测方案38套,已覆盖全部应用系统,业务需求预测准确率提升至85%,资源扩容时间缩短至2小时以内。

  故障根因定位:在故障场景、告警事件发生后,基于6PB的运维大数据,自动调用大模型诊断工具,实现分层拓扑监控、故障定界、一站式定位故障根源,大幅提升运维响应效率。

  2.节能智控,构建能效管理中枢

  兴业银行通过构建精细化、智能化的能效管理体系,实现资源调度的全面升级。

  精准能效调优:实时采集机房各区域的温度、湿度、气流等数据,生成动态热力图谱;结合设备功率负载分析,对空调机组进行参数自优化,降低数据中心整体PUE。

  资源效率管理:基于数据中心数字孪生平台,通过数据整合分析来模拟、验证、预测、控制物理实体全生命周期的过程,最终形成智能决策的优化闭环,在选址规划、施工建设、运营管理等阶段实现智能推理和决策,提升整体运维效率。

  智能算力优化:对当前与历史的算力资源监控数据及业务流量监控数据进行深度分析,从而优化资源调度策略,自适应分配算力节点,在保障服务QoS的前提下,使算力节点利用率提高至85%,高优先级任务抢占延迟小于100毫秒,首次响应时间缩短至500毫秒以下。

  3.容灾筑防,护航业务连续安全

  兴业银行全面构建智能化容灾管理体系,实现从灾备建设到应急处置的全流程自动化,为业务连续性提供坚实保障。

  容灾预案生成:基于系统架构信息,自动生成容灾预案并制定应急演练方案,已支撑全行400多个信息系统生成5000多套容灾预案。

  智能一致性检查:通过分析生产与灾备子系统在配置、日志、监控数据等方面的多维度信息,自动比对一致性情况,评估灾备系统的可用性,采用应用程序、环境配置、数据文件等多维度的一致性比对方案,覆盖全部同城、异地数据中心的多活、灾备子系统的智能检查比对。

  恢复决策支持:结合故障信息与应急预案,快速生成可一键执行或自动执行的应急处置方案。

  4.智驱运维,实现质效协同跃升

  兴业银行通过智能化工具链重构运维作业模式,提升人机协同效率以及运维整体效能。

  告警策略优化:通过对告警进行二次筛查,从告警中快速溯源,定位故障源头,并优化告警策略,减少无效告警,提高告警的准确性和及时性,日均分析监控事件数据近10万条,告警数量下降60%,告警有效率提升15%。

  工单智能分配:利用智能分析技术,精准识别运维需求工单的分类,并将其自动分配至相应的处置团队,提高了问题处理效率,减少了人为干预带来的延误。

  风险隐患分析:整合故障告警、系统日志、变更脚本、批处理策略等多源数据,进行综合分析,在识别潜在风险后调度工单系统生成修复工单并将其分配至运维处置团队。

  四、擘画智算蓝图:打造可持续演进的智慧生态

  当技术能力与场景实践趋于成熟时,构建开放、协同、可持续的智算生态成为下一步命题。兴业银行智算中心将以生态化思维破解技术孤岛与资源壁垒,为金融业务数智化转型提供生生不息的动力引擎,擘画面向未来的智慧金融新图景。

  1.筑造智能算力基座

  算力基座是金融智算的核心引擎。面对复杂的国际形势,兴业银行坚持全栈式算力体系布局,推进现有数据中心的智能算力自主可控建设,同时承担国家“东数西算”战略使命,高标准新建贵安数据中心。一方面,采用“国产设备+异构架构”技术路线,融合多种计算芯片,构建异构计算集群,满足不同智能化场景应用的算力需求;另一方面,建立算力质量评估体系,从算力密度、能效比、服务可用性等维度确保基础设施持续满足人工智能训练推理需求,构建绿色、智能的算力底座。

  2.构建自愈韧性中枢

  智算中心作为关键信息基础设施,其稳定性与可靠性至关重要。在底座自愈方面,兴业银行积极打造基于数字孪生的智能运维中枢,实现环境和设备故障的自愈预案和自动推演;同时,通过系统画像、大模型和机器学习技术建立多层面的故障自愈机制,结合自动化处置策略,快速隔离与修复故障,缩短业务中断时间,保障业务连续性。

  3.打通产学研协同链条

  智算中心的发展需要产业界、学术界与研究机构的紧密合作。兴业银行已与厦门大学开展数字孪生领域的创新合作,未来将与更多高校、科研院所、企业联合研究,共同攻克人工智能算法优化、国产设备兼容适配等关键技术难题,加速科研成果转化,推动智算技术研究的应用落地,助力金融行业数字化转型。

  4.健全智算治理体系

  兴业银行正积极制定人工智能资源使用规范、数据安全管理办法和服务质量保障制度。一方面,发布数据安全、隐私保护、能效评估等标准,确保数据全生命周期的安全与合规使用;另一方面,评估智算服务质量,确保金融业务获得优质、高效、安全的智算服务。

  沧海横流显砥柱,万山磅礴看主峰。兴业银行智算中心以自主可控的技术生态为砥柱,锚定支撑金融数字化转型之峰,深度践行“人工智能+”战略部署,以创新为笔、以算力为墨,擘画运维场景的智能变革图谱,助力“数字中国”构筑金融科技之基。
 
过刊查询
2022年03月 2022年02月 2022年01月
2021年12月 2021年11月 2021年10月
2021年09月 2021年08月 2021年07月
2021年06月 2021年06月 2021年05月
查看所有过刊
本期精选
《中国金融电脑》2025年第6期目录
智算新基建:“领航AI+”战略牵引下的数..
农业银行智算中心转型探索实践
人工智能推动交通银行数据中心向智算中心..
打造领先智算数据中心,筑牢数智化转型根..
平安证券算力底座虚拟GPU规划建设
兴业银行智算中心的探索与进化之道
 
企业简介 | 版权声明 | 免责声明 | 频道介绍 | 安全提示 | 法律顾问 | 网上投稿 | 客服电话 | RSS订阅
Copyright © 2005 Fcc.Com.Cn, All Rights Reserved. ,《中国金融电脑》杂志社版权所有
电话:010-51915111-805 传真:010-51915236,网络出版服务许可证(署)网出证(京)字第337号
京ICP备14024077号-1 京公安网备:11010802025321 技术支持:站多多