博客 袋鼠云产品功能更新报告15期|数据资产能力再升级!

袋鼠云产品功能更新报告15期|数据资产能力再升级!

   数栈君   发表于 2025-11-24 14:04  1020  0

近期,我们围绕数据资产产品进行了一系列功能新增与优化,重点加强了对国产数据源的兼容、数据安全管控能力以及平台性能与易用性。这些更新将为您构建更高效、更安全、更易用的数据治理底座。以下为第15期袋鼠云产品功能更新报告,请继续阅读。

功能新增

重点新增内容

全面适配国产化数据源,强化信创能力

为积极响应国家信创战略,袋鼠云数据资产平台持续深化与国产数据库的融合,本期重点新增对 DM for Oracle  Kingbase8.6 的全面支持,进一步夯实数据治理的自主可控底座。

  • 支持 DM for Oracle 全功能生态:全面支持 DMDB for Oracle 类型的元数据采集(包括血缘分析、元模型管理)、规范建表(支持设置表名、中文名、表生命周期、表结构如主键、分区等)及数据质量校验(支持单表校验、质量报告、脏数据存储)。

  • 支持 Kingbase8.6 数据质量功能验证:数据质量模块支持对 Kingbase8.6 数据源进行单表校验、多表比对、规则集、质量报告等功能验证,保障国产数据源的数据质量。

数据安全防线升级,保障资产合规

为满足企业对数据安全和合规性的高要求,我们对数据安全模块进行了重要升级,将管控范围拓展到离线开发环境,并提供更灵活的安全展示手段。

  • 数据脱敏支持管控离线开发平台,规则配置更灵活:脱敏规则配置新增支持遮盖、转义、算法加密三种脱敏方式;生效范围支持按人群圈定,实现更精细化的脱敏管理。同时,针对 Hive、Doris 类型数据源,脱敏规则支持应用到离线开发平台,确保在开发环境中敏感数据依然安全可控。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/04fc97fd636ab97d213f286bb4c382f9..png
http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/918f39c983b7efd676b8695fc069b3ef..png
  • 对接公共组件,支持水印配置:平台已对接公共组件的水印设置功能,支持在数据下载、文件导出以及平台所有页面展示水印,有效防范数据泄露和非法截屏,全面保障数据安全。
http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/30b2d44e35478fd53c5c43b91c035c10..png
http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/03bde27613aee04f79204ba65aeb916e..png
丰富数据模型类型,提升湖仓一体化建表能力
  • 支持 Doris 2.x 类型数据源建表:规范建表功能支持 Doris 2.x 类型数据源,支持在建表过程中配置主键表、聚合表、明细表,并支持配置动态分区、范围分区、列值分区,极大地丰富了湖仓一体化下的建表能力。
http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/744ee0335651f16a2f68d9a66c806374..png
http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/37f2ce0bb4e4451b58a30e3649f716cd..png
  • 支持 Hive 类型数据表引入:数据模型模块现已支持引入数据地图中的 Hive 类型数据表,并能按照模型约定的格式进行规范校验和统一管理,提升模型的完整性和一致性。
http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/1b7d41d959cac3cdc413ce2a6bc29977..png

国际化支持,满足全球化部署需求

  • 数据资产平台支持国际英文版:数据资产平台现已支持切换展示语言(英文/中文),全面适配全球通用语言体系,满足全球化部署和使用需求。
http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/5743c5fe7b841a25d23f7c44283d041e..png

其他新增内容

  • 元数据:
    • 元数据同步任务支持通过控制台自定义参数配置指定同步用户。
    • SparkThrift 元数据周期同步支持配置环境参数,提升任务稳定性。
    • 支持 Inceptor 存储过程的血缘解析(包括 create…select… 以及 insert…select… 语句)及 Inceptor 视图类型采集。
    • 元数据管理支持批量删除数据库(仅删除资产内的数据信息)。
  • 数据治理:新增支持S3 小文件合并治理,支持 remote 合并,可进行周期合并或一次性合并;代码规范检查新增支持 Doris SQL(在离线开发平台生效)。
  • 数据标准:码表管理支持列表全量或筛选导出功能;数据标准列表支持查看被绑定字段的统计和下钻查看。
  • 数据地图:字段支持查询字段标签,并统计累计使用。

功能优化

重点功能优化说明

元数据同步性能与准确性双提升

针对元数据同步中可能出现的效率和状态展示问题,我们进行了内核级的优化。

  • 元数据同步中分区/存储计算逻辑优化:针对分区表数量多导致的同步慢问题,将分区数量、存储量等信息改为后置计算。优先同步可快速获取的元数据信息至数据地图,大幅提升同步效率。同时,Hive 分区信息每次同步将只同步对比上次更新时间发生变更的分区表信息。
  • 元数据周期同步中优化“同步状态”的展示逻辑:统一规范任务实例状态展示:任务中若存在部分同步失败,实例状态依然展示为“同步完成”;只有当所有数据表均同步失败时,状态才显示为“同步失败”,提升了运维监控的准确性。

消除数据冗余,规范资产管理

  • 相似数据源逻辑优化:从资产侧去除相似数据源逻辑。针对同一个集群、同一个计算引擎,只将第一个生成的 meta 数据源作为资产默认引入的数据源。此举有效解决了相似数据源导致的数据重复、数据权限配置不统一等问题,确保了数据资产的唯一性和规范性。
http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/cd7db52c1e9c987a8ab4959c367547ef..png

简化模型协作与建表流程

  • 数据模型审批流程优化:数据开发角色提交的建表审批被审批人驳回或自行撤回后,该模型支持编辑和修改。此外,若审批中心关闭流程,则不涉及审批功能,直接新增、编辑、删除成功。
  • 数据模型建表取数据源逻辑优化:数据源的 db/schema 信息在建表时可自动获取,无需与元数据同步模块关联。解决了无数据表同步时无法查询底层 db/Schema 的问题,简化了建表操作。

数据质量临时表改造与能力增强

  • 质量临时表生成逻辑改造 & StarRocks 支持脏数据存储:质量任务生成的临时表由“一实例一表”改造为“一类数据源一表”,减少了临时表的数量,降低了运维复杂度。同时,StarRocks 2.x、3.x 类型数据源在质量模块支持脏数据存储,方便用户进行溯源分析。
  • 数据质量规范性校验优化:规范性校验中,字符串长度校验逻辑修改为存在一个不符合的即校验不通过。同时,字符串最大/最小长度校验规则支持多种波动检测方法(包括固定值、1天波动、7天波动、月度波动、7天平均值波动、月度平均值波动检测),提升校验的准确性和灵活度。
  • http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/08e17921e44d119404be5f3d96a901b7..png
    http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/d8fb51780d3594554aaacf8ba309cb56..png

其他功能优化

  • 数据资产:优化数据地图查询性能、首屏接口,提升页面加载速度;修复所有库表联动与远程搜索等场景的数据接口竞态问题;更新引导页,新增数据治理和数据安全模块的体现;优化 AI 交互方式。
  • 数据标准:词根删除/编辑无需判断是否有标准引用,操作更灵活;词根列表中被引用数量支持下钻展示具体的被引用标准列表。
  • 数据模型:Inceptor 建表存储格式扩充支持 PARQUET、JSON 等多种格式;建表配置支持管理员控制可创建的数据源类型,流程更规范;建表第一步骤需先选择数据源再配置存储格式/类型;批量解析后针对未匹配到标准的字段支持修改中文名。
  • 元数据:周期同步任务列表支持展示最近一次实例状态;元模型-个性模型支持展示添加的应用库列表
  • 数据地图:支持字段级别的模糊查询;调整表详情-技术属性的展示顺序。
  • 数据质量:优化前端 FPS 性能;优化编辑规则页面交互。
  • http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/5b359a4808d298da04616896299ef6c0..png
0条评论
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料