AI 原生
数据治理智能体

DGAgent — 语义驱动 · 主动治理 · 价值可见

构建 AI 时代的高质量数据底座。自动化承担数据挖掘、清洗与语义对齐的繁重工作,为企业大模型与智能应用持续交付准确、有语义的高质量数据集。

交付周期 周→天
人工效率 提升 300%
大模型用数 语义驱动
AI 集成 MCP 协议
DGAgent 智能助手
生成一份近30天的新增付费用户日报,包含来源渠道和金额字段。
AI
收到。正在解析意图并执行数据链路...
AI
扫描元数据:识别 CRM 系统 user_base 表与交易系统 order_list 表
采集任务:创建多源同步任务 (MySQL/Oracle → ODS)
数仓建模:构建 DWD 层 dwd_user_order_detail 宽表
加工任务:生成多表关联计算逻辑 (Join/Agg)
质量检测:非空校验
API 封装:生成服务接口与文档
AI
数据集已就绪
new_paid_users_daily
idsourceamount

已发布至数据目录,API 接口调用权限已开通。

行业洞察

从为 BI 治理数据,到为 AI 治理数据

AI 时代对数据治理提出了全新要求,传统模式正面临三重挑战

需求之变:从服务 BI 到服务 AI

  • 过去数据治理服务于 BI 分析——分析师编写 SQL,业务人员查看报表
  • 现在数据还需服务于 AI 应用——大语言模型、RAG、Agent 需要数据自带上下文
  • AI 无法容忍歧义和错误,数据必须准确且有语义

代价之重:80% 的精力消耗在数据准备

  • 据行业实践统计,AI 项目约 80% 的工作量消耗在数据准备与治理环节
  • 数据治理是公认的脏活累活,需要堆人去干
  • 信息科技部门投入大量人力物力,成本高且不可持续

价值之困:做得越多越没存在感

  • 业务部门感知不到治理带来的价值,配合意愿低
  • 管理层难以评估治理工作的实际成效,过程中难以获得资源支持
  • 做出成果后也不被认可,治理团队陷入困境

DGAgent 围绕三大核心理念,系统性解决这些问题。

核心理念 01

语义驱动 — 从为 BI 治理数据,到为 AI 治理数据

语义就是 AI 的上下文,数据的语义与数据本身同等重要

对话式治理界面
上月各产品线毛利率

已为您查询上月各产品线毛利率:

企业服务42.3%
数据产品38.7%
云基础设施21.5%

数据来源:dws_finance_monthly · 更新时间:2024-01-02

对话式治理

通过自然语言对话完成数据查询、标准定义、口径注册、问题诊断。业务人员无需了解表名和 SQL,将治理门槛从「技术配置」降低为「业务对话」。

治理全流程加速:周级 → 天级

自动化语义补齐

AI 自动识别缺失的字段含义、口径定义、业务分类、数据血缘,基于上下文智能推荐并补齐,大幅减少人工标注工作量。

语义全覆盖
语义补齐面板
customer_id

客户唯一标识,关联 dim_customer

已补齐
order_amt

订单金额(元),含税

已补齐
col_x7

AI 推荐:产品分类编码

待确认
flag_2

未识别,需人工标注

缺失

口径注册中心

统一定义指标口径,版本化管理,场景化推荐。解决「为什么财务毛利率和销售毛利率不一样」的经典问题。

V1 财务口径
(营收-成本)/营收×100%
适用场景:财务报表、审计
V2 销售口径
(营收-直接成本)/营收×100%
适用场景:销售分析、绩效考核
核心理念 02

主动治理 — 让数据不需要治理

数据治理是公认的脏活累活,DGAgent 将人从繁琐工作中解放出来

数据质量监控面板
dws_order_daily
98
dws_finance_monthly
95
dws_inventory_rt
42
⚠ dws_inventory_rt 数据量异常 -90%
根因:上游采集任务 pipeline_erp_order 执行失败
建议:检查 ERP 数据源连接状态

AI 自动巡检与预警

AI 智能体自动巡检核心表数据质量,发现异常即时推送预警,附带根因分析和修复建议。治理团队从「手工操作」转变为「审核确认」。

问题排查:半天 → 5 分钟

问题分类与对症下药

不是所有数据问题都该修数据。客户编码不统一,根因可能是缺乏统一的主数据管理流程。DGAgent 自动区分问题类型,对症下药。

数据问题
技术修复
标准问题
细化定义
业务问题
优化流程

治理前置到数据生产环节

将治理延伸到数据生产环节,通过端侧插件在数据录入时即完成质量校验,从源头控制数据质量,实现数据的「自动驾驶」。

Excel 插件
嵌入日常办公工具,数据录入即治理
  • 模板下载:内置校验规则
  • 实时校验:类型/格式/枚举/唯一性
  • 智能填充:基于历史数据推荐
  • 一键上传:校验通过后提交
浏览器插件
网页数据采集自动带上来源与校验
  • 页面数据识别:自动检测表格
  • 实时校验:比对平台标准
  • 来源记录:URL/时间/操作人
  • 数据导入:附带溯源元数据
剪贴板助手
复制粘贴间完成格式标准化
  • 数据识别:日期/手机/金额等
  • 格式校验:比对标准格式
  • 一键修复:自动标准化转换
  • 修复记录:全程可追溯
四维质量校验模型
完整性 30%准确性 30%一致性 20%时效性 20%
核心理念 03

价值可见 — 数据治理的背后,是业务治理与组织治理

数据治理的本质是业务治理。业务部门定标准、认领问题、确认规则——AI 自动完成技术层面的脏活累活。让每个参与者有责任感,更有成就感。

对上可见

组织参与度仪表盘

哪个部门参与了、参与程度如何、带来了什么价值——管理层一屏掌握。

87/100
数据健康度
6/8
部门已参与
部门 / 子公司参与排名
1
财务部95
定义 12 项口径标准
2
华东子公司91
认领 8 项数据问题
3
供应链中心86
确认 15 条校验规则
对外可见

业务协同工作台

业务部门定标准、认领问题、审核规则。治理的不只是数据,更是业务规则本身——有责任感,更有成就感。

财务部标准制定
定义「毛利率」口径标准,统一全集团计算规则
销售部问题认领
认领客户编码不一致问题,推动 CRM 主数据治理
供应链规则审核
确认库存数据校验规则,保障供应链数据准确性
业务部门从「被动配合」变为「主动参与」
治理业务规则 = 治理数据质量
对内可见

AI 自动治理 + 成效追溯

纯技术层面的数据治理工作由 AI 自动完成,治理团队只需审核确认。每项动作可追溯、可度量。

01-15 09:32AI 自动
AI 自动修复 customer_id 映射异常
3 张报表恢复正常
01-14 14:18AI 自动
AI 自动补齐 dim_product 语义标注
语义覆盖率 +12%
01-13 10:05人工审核
张工审核确认 AI 修复方案
确认 5 项自动修复生效
本月 AI 自动处理87% 治理动作无需人工介入
企业级部署

安全可控,开放集成

满足央国企安全合规要求,无缝融入 AI 技术生态

信创环境全栈适配

适配国产操作系统(麒麟、统信)、国产数据库(达梦、人大金仓)、国产中间件。通过信创环境兼容性验证。

支持本地模型 + 内网部署

支持完全内网部署,数据不出企业边界。支持接入本地部署的大语言模型(DeepSeek、Qwen 等),无需依赖外部 API。

MCP 协议对接 AI 工具链

通过 MCP 协议让 AI 应用直接消费治理后的高质量数据。支持对接 Claude、ChatGPT、Cursor、企业自建大模型等。

MCP 调用示例
// 通过 MCP 协议获取治理后的高质量数据
const result = await mcp.call("dgagent/query", {
  question: "上月各产品线毛利率",
  format: "table",
  include_semantics: true,
  include_lineage: true
});
// result.data — 结构化数据
// result.semantics — 字段语义与口径定义
// result.lineage — 数据血缘追溯链
平台对比

DGAgent 对比传统平台

从理念到落地,全方位升级

对比维度传统数据治理平台DGAgent(AI 智能体)
治理目标为 BI 治理数据为 AI 治理数据(适配大模型)
交互方式复杂的表单配置自然语言对话(NL2SQL / NL2Action)
语义定位可选的注释信息必选的基础设施(Schema 对齐)
语义补齐人工逐一标注(成本高)AI 自动识别并补齐(高效准确)
工作方式堆人干活(依赖专家)AI 智能体自动执行
业务参与被动配合(数据部门主导)业务协同工作台,主动参与
治理时机事后修补(问题发生后)前置到数据生产环节(端侧插件)
价值衡量效果说不清(缺乏量化指标)三层可见,ROI 完全可量化

准备好为 AI 提速了吗?

了解 DGAgent 如何助力您的数据治理