袋鼠云产品功能更新报告15期|数据资产能力再升级!
数栈君
发表于 2025-11-24 14:04
1020
0
近期,我们围绕数据资产产品进行了一系列功能新增与优化,重点加强了对国产数据源的兼容、数据安全管控能力以及平台性能与易用性。这些更新将为您构建更高效、更安全、更易用的数据治理底座。以下为第15期袋鼠云产品功能更新报告,请继续阅读。
重点新增内容
全面适配国产化数据源,强化信创能力
为积极响应国家信创战略,袋鼠云数据资产平台持续深化与国产数据库的融合,本期重点新增对 DM for Oracle 和 Kingbase8.6 的全面支持,进一步夯实数据治理的自主可控底座。
支持 DM for Oracle 全功能生态:全面支持 DMDB for Oracle 类型的元数据采集(包括血缘分析、元模型管理)、规范建表(支持设置表名、中文名、表生命周期、表结构如主键、分区等)及数据质量校验(支持单表校验、质量报告、脏数据存储)。
支持 Kingbase8.6 数据质量功能验证:数据质量模块支持对 Kingbase8.6 数据源进行单表校验、多表比对、规则集、质量报告等功能验证,保障国产数据源的数据质量。
数据安全防线升级,保障资产合规
为满足企业对数据安全和合规性的高要求,我们对数据安全模块进行了重要升级,将管控范围拓展到离线开发环境,并提供更灵活的安全展示手段。
丰富数据模型类型,提升湖仓一体化建表能力
国际化支持,满足全球化部署需求
其他新增内容
元数据同步任务支持通过控制台自定义参数配置指定同步用户。
SparkThrift 元数据周期同步支持配置环境参数,提升任务稳定性。
支持 Inceptor 存储过程的血缘解析(包括 create…select… 以及 insert…select… 语句)及 Inceptor 视图类型采集。
元数据管理支持批量删除数据库(仅删除资产内的数据信息)。
重点功能优化说明
元数据同步性能与准确性双提升
针对元数据同步中可能出现的效率和状态展示问题,我们进行了内核级的优化。
元数据同步中分区/存储计算逻辑优化:针对分区表数量多导致的同步慢问题,将分区数量、存储量等信息改为后置计算。优先同步可快速获取的元数据信息至数据地图,大幅提升同步效率。同时,Hive 分区信息每次同步将只同步对比上次更新时间发生变更的分区表信息。
元数据周期同步中优化“同步状态”的展示逻辑:统一规范任务实例状态展示:任务中若存在部分同步失败,实例状态依然展示为“同步完成”;只有当所有数据表均同步失败时,状态才显示为“同步失败”,提升了运维监控的准确性。
消除数据冗余,规范资产管理
简化模型协作与建表流程
数据质量临时表改造与能力增强
质量临时表生成逻辑改造 & StarRocks 支持脏数据存储:质量任务生成的临时表由“一实例一表”改造为“一类数据源一表”,减少了临时表的数量,降低了运维复杂度。同时,StarRocks 2.x、3.x 类型数据源在质量模块支持脏数据存储,方便用户进行溯源分析。
数据质量规范性校验优化:规范性校验中,字符串长度校验逻辑修改为存在一个不符合的即校验不通过。同时,字符串最大/最小长度校验规则支持多种波动检测方法(包括固定值、1天波动、7天波动、月度波动、7天平均值波动、月度平均值波动检测),提升校验的准确性和灵活度。
其他功能优化
数据资产:优化数据地图查询性能、首屏接口,提升页面加载速度;修复所有库表联动与远程搜索等场景的数据接口竞态问题;更新引导页,新增数据治理和数据安全模块的体现;优化 AI 交互方式。
数据标准:词根删除/编辑无需判断是否有标准引用,操作更灵活;词根列表中被引用数量支持下钻展示具体的被引用标准列表。
数据模型:Inceptor 建表存储格式扩充支持 PARQUET、JSON 等多种格式;建表配置支持管理员控制可创建的数据源类型,流程更规范;建表第一步骤需先选择数据源再配置存储格式/类型;批量解析后针对未匹配到标准的字段支持修改中文名。
元数据:周期同步任务列表支持展示最近一次实例状态;元模型-个性模型支持展示添加的应用库列表。
数据地图:支持字段级别的模糊查询;调整表详情-技术属性的展示顺序。
数据质量:优化前端 FPS 性能;优化编辑规则页面交互。