在十五五规划与人工智能时代交汇的背景下,央国企集团侧的数字化建设迎来全新机遇与挑战。如何顺接“十四五”期间数字化转型所积累的数据成果,借助AI能力实现管理升级与业务穿透,成为集团型企业的核心命题。本次袋鼠云解决方案专家红发围绕基于5A架构的央国企Data+AI一体化融合解决方案,从穿透式监督、数据治理、数据资产、AI能力建设等维度,系统阐述集团侧数字化建设的整体方案与实施路径。
在十五五及AI时代,央国企集团侧首先需要通过数据实现穿透式监督。过往许多国央企已开展股权、财务、投资等领域的穿透式管理,其核心在于集团面向下级成员公司建立数据标准,形成数据向上传达的链路。借助AI能力及“十四五”期间建设的数据中台与数据治理成果,可利用更高标准、更高规范的数据开展新的穿透式监督工作。
数据治理方面,过往以数仓、数据中台为载体。在AI时代,数据治理的重心一是基于过往成果沉淀出完整体系,包括数据治理委员会的建设,将管理方、业务方、IT方深度融合;二是从制度、流程、规范等层面推动数据治理上升为一号工程。十五五阶段的数据治理还应包含多模态数据治理,面向音频、视频、文本、图片等非结构化数据,依照结构化数据治理的标准化工作,从元数据到数据标准、质量把控、数据安全,全面应用于多模态数据。
数据资产方面,包含企业内部数据资产与行业数据资产。企业内部数据资产是指成员公司将自身数据沉淀为资产,经开放共享后内部交换互通,形成价值流通,减少数据壁垒,如供应链采购数据在不同子公司间具有高复用性。行业数据资产例如煤炭行业头部企业,其数据经加工脱敏后可形成行业数据资产,与上下游及兄弟单位交易流通,实现内部数据变现。第三块是高质量数据集,面向多模态数据的治理与沉淀,借助AI算子和算法,有效进行标识、评价及后续使用。再往后是可信数据空间,实现范围内数据共享并保证安全性与可追溯性,进而形成数据要素流通体系。
AI建设方面,首先是算力平台搭建,包括底层GPU服务器、硬件网络及大模型一体机。大模型分为通用型通识类大模型和垂类大模型。通用大模型主要针对自然语言转文字、SQL、代码等能力,成熟度逐步上升,但缺少行业标识性,需要借助多模态生成的高质量数据反哺企业内部知识库,形成行业或垂类大模型,两者结合提升算法准确度。基于此类大模型,可沉淀企业内部多模态知识库,通过问答方式快速访问政策文档、流程文档、图片、音频、视频等,并通过数据关系图谱实现多模态数据上下游关联与交互。企业知识图谱及面向业务流程的智能体应用,都在未来五年建设范畴之内。
从国央企集团背景看,所有客户都面临一个集团加多级成员公司的架构,管理到最末端成员公司时跨越的管理层级、业务流程层级和数据层级非常多,需要一套自上而下包括自下而上的全链路管控体系。各成员公司因国资委监管报送要求,需按标准规范沉淀财务、投资、党建等数据并上报。集团公司承担经营、财务、采购、供应链、党建、投资等管控职能,需要各成员公司将经营类数据上报至集团进行统一汇总、计算、治理。
业务现状方面,集团与成员公司常存在业务系统统建与自建并存的情况,业务系统多、业务流程多样,管理方和使用方不同,导致数据管理成本升高。加之需面向非结构化数据进行多模态治理,IT和数据管理成本越来越高。
面向十五五阶段,袋鼠云提出了基于国央企5A架构的Data+AI一体化融合解决方案。在原有4A架构(业务架构、数据架构、应用架构、技术架构)基础上,增加管控架构。管控架构的核心是抓住核心业务域,如经营域(财务、业财相关)、党建、投资类数据域,具体生产设备等数据由成员公司自建,集团提出要求并按规范建设本地业务域。业务架构需保证业务流程透明化、统一化,但业务系统可以分散,各成员公司可拥有符合自身业务板块特性的业务流程和系统。数据架构需保证数据一致性,面向财务、经营类指标需在不同业务板块间统一拉通,由集团数据部门构建统建数据和业务指标规范,下发给成员公司上报对应数据,构建可穿透式监管的数据体系。应用架构提供技术、数据及业务流程能力给各成员公司,使其基于底层技术底座和数据能力构建上层应用体系。技术架构需与时俱进,在AI时代通过大模型、Agent等工具快速搭建应用系统,并借助AI完成底层数据治理工作,由集团统一拉通最新技术并赋能给各成员公司。
集团公司应有一套统一的数据资产化门户入口。首先,各业务板块及集团公司本体拥有大量数据和应用,若具备高复用性和高价值,应在统一数字化门户中呈现,形成数据资产交互、交换的机制,如数据超市。其次,集团内部有大量指标需要查看,包括分级分类可下钻的业财类、经营类、党建类指标,从集团公司到各成员公司逐级查看。第三,面向赋能类,如AI能力、先进技术,可在门户中发布,包括大模型可搭建何种应用、解决何种问题等。通过数字化门户,将数据建设和IT建设成果开放给管理方和业务方。
构建数字化门户需要:数据标准化地从各成员公司上报至集团,从公共类数据及行业属性数据两个维度沉淀,定义好格式、标准、规范后,成员公司通过数据通道上报,形成标准数据上报架构,满足监管报送及内部管理需求。同时,通过数据手段实现穿透式监督,集团定义核心业务、核心管控指标及根因分析逻辑的关联性数据。两套体系建好后,在数字化门户中实现业务经营画像和管理穿透监督,为内部及未来外部数据资产流通打好基础。
通过多模态数据平台推进高质量数据集建设,需具备三个要点:数据类型广,不局限于业务系统结构化数据;数据体量大;数据质量要求有新标准。对于非结构化数据,如图片,如何判定高质量或高价值,涉及打标、标识等工作,需借助AI能力校验,并验证识别结果的正确性。面向多模态数据的数据标准、元数据定义、数据资产沉淀形式,以及使用方式是直接使用还是提取特征进行共享,都是高质量数据集建设中的内容。袋鼠云数栈最新发布的7.0版本已包含多模态数据从底层原始数据通过加工治理形成高质量数据资产或数据集,为上层AI大模型提供底层数据或知识库的能力,实现一站式平台对结构化和多模态数据进行统一存储、开发、治理、沉淀资产、使用。

数字资产门户的落地方式上,过往更多在企业内部沉淀数字资产,未来从沉淀过渡到运营。运营涉及数据提供方(各成员公司)、管理方(集团IT或数据团队)、使用方三方。管理方需要统一的组织和制度,从决策层到执行层,每层的数据岗位、职责、权限、流程均需定义。业务方也需设置数据治理专员,例如财务数据治理专员负责保证财务业务系统数据的质量和标准。数据管理方提供统一平台、统一数据架构、统一数据治理流程和规范。集团数据团队定义统一标准,明确各租户下哪些数据域上架到数据门户共享复用,哪些放在租户本地作为私有数据。最终核心可共用的数据资产上架到数据门户,展示资产大盘、数据应用、数据超市、数据需求提出与交付的完整流程。数据使用方通过门户进行申请、使用、查看等权限及流程审批,形成良性数据流通循环。
AI智能体应用方面,当前客户不再满足于静态、固定的报表和看板,更希望结合具体业务流程沉淀出业务智能体。传统数据分析通过大屏、报表或指标页面沉淀固定看板,指标预设、维度预设,数据及时性基本按天、周、月、季度,无法满足管理时效性及业务复杂性要求。因此许多客户将数据分析演变为业务智能体模式,例如项目复盘场景。项目复盘不仅要看核心指标,还需基于指标进行跟进分析,涉及项目系统上下游的数据汇聚,包括文档、政策、中间过程项目管理数据。汇总后,结合内部政策和国家政策进行审计,通过AI自动生成项目复盘报告,包含项目过程数据、结论数据、与业内同类项目对比数据。借助客观实时数据,将以往人工收集、人工加工的过程转变为AI自动化过程。还可在项目过程中进行预判,提前预警可能出现风险的项目,结合历史数据和算法算子进行提前告警。项目执行后,核心指标如收益率、成本周期等可通过AI快速生成,无需人工手动配置。
数字孪生方面,过往多通过大屏、孪生、3D孪生等技术对内部数据和流程进行展示,主要应用于展厅、指挥中心等场景。现在通过企业或集团公司的业务穿透、数据穿透要求,可利用孪生方式对内部业务流程和数据流程进行统一穿透管理。可将某一项业务的完整业务流程在孪生大屏中展现,同时将完整的数据上下游——通过数据治理、数据平台、数据加工链路沉淀了哪些业务系统的哪些数据,经过哪些系统、字段、表,沉淀出哪些数据资产——在孪生中统一呈现,直观帮助业务方和管理方了解企业内部业务流转和数据流转的现状。
面向一家央企的整套数据架构为“1+1+3+N”架构。第一个“1”是一套数据资产门户界面;第二个“1”是一套数据开发治理平台;“3”是三种数据管理模式;“N”是多个数据租户。三种模式:集团统建类(如财务数据由集团IT团队建设并放在公共数据中);集团与成员公司共建类(如合同数据,双方共建形成公共数据);成员公司私有化数据(如生产制造、工厂等,由成员公司自建放在本地租户中)。通过多租户方式管理和隔离、共享不同成员公司及集团之间的数据,实现跨租户的数据和任务共享传输。
面向国央企的AI智能体应用案例中,许多客户已自建算力平台、通用大模型和垂类大模型。建设路径分为三项:对现有业务进行完整业务流程盘点;数据侧穿透,明确端到端数据流程应沉淀哪些指标及维度;AI流程,明确各节点需要的AI问答、检索、预警、文档生成等功能。将业务、数据、AI三者能力统一整合后,搭建一键式生成、对话式应用、指标报表模板等功能,以Agent对话方式实现业务流程流转,并不断优化底层本地化知识库,保证准确率的持续迭代。
本次整体方案基于5A架构,系统阐述了央国企集团侧在十五五及AI时代下Data+AI一体化融合的全局建设思路,后续将围绕数据治理、经营分析等专场进行更深入的介绍。
如需了解完整方案,可扫码添加小助手快速获取~