博客 袋鼠云产品功能更新报告06期(实时开发篇)|数栈产品功能升级,做产品我们是认真的!

袋鼠云产品功能更新报告06期(实时开发篇)|数栈产品功能升级,做产品我们是认真的!

   数栈君   发表于 2023-07-13 10:28  1073  0

实时开发平台


新增功能更新


1.新增【运维总览】模块

  新增功能说明  

背景:之前实时平台的运维都是针对单任务的,缺乏全局性的运维统计和分析能力,并且缺乏对运行中任务的监控分析。因为实时任务一旦运行失败,就会立即对线上数据服务产生影响,我们希望能在任务失败之前,就能发现各种潜在风险。


新增功能说明:新增【运维总览】菜单,支持统计项目任务总数、状态分布、类型分布,通过健康分模型,对每个运行中的任务进行健康评分。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user166259/article/e806233f974d92b51ee12cd573fd5b78..jpg

(新增功能示意图)


2.新增【全局告警】功能

  新增功能说明  

背景:之前的实时任务告警规则,需要在每个任务的运维页面单独配置,相当于以任务维度进行管理。但是在实际开发中,比如任务失败这种场景,一般需要对每个任务都进行配置,但是这样在每个任务上单独操作又非常繁琐。


新增功能说明:新增【全局告警】功能,以规则维度进行管理,每个规则可同时应用到多个任务上。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user166259/article/9a7352e018ba7c49ca4ae57779fdc235..jpg

(新增功能示意图)


3.新增【日志关键词】监控告警规则

  新增功能说明  

背景:实时任务在运行过程中,往往会出现任务状态运行正常,但是实际日志已经开始出现各种报错信息的情况,比如 Exception、Error、Fail 等,这类关键词的出现意味着任务的不稳定。我们需要在任务真正失败之前及时感知到运行日志中出现了这类关键词,然后提前去解决。


新增功能说明:全局告警新增【日志关键词】规则,平台自动创建相应的实时监控任务,前提是需要在任务开发时,开启该任务的日志打印功能。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user166259/article/aadf2cbb79b0bcf9834071962819a15e..jpg

(新增功能示意图)


4.告警规则新增【告警级别】、【告警恢复】配置项

  新增功能说明  

背景:之前的告警规则没有区分等级,用户同时收到较多告警时,不确定需要先处理哪个问题,并且告警问题修复后,也没有通知消息,运维成本相对较高。


新增功能说明:新增告警级别(紧急/重要/次要/提示);告警规则新增是否开启恢复通知配置项。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user166259/article/6c030b7dbe5e1d3270766196e6933b21..jpg

(新增功能示意图)


5.新增【数据源】适配

  新增功能说明  

• FlinkSQL 源表、结果表新增支持 Ckafka、CMQ 数据源类型

• Flink1.10 支持的 HBase2.x 和 Phoenix5.x 插件,适配 Flink1.12

• FlinkSQL 维表、结果表新增 Hyperbase 数据源

• Flink1.10 支持的实时采集 PGWal 插件,适配 Flink1.12

• Kafka 读取类型新增 Raw Format


功能优化


1.优化【字段级血缘解析】能力

  体验优化说明  

背景:之前实时平台的字段级血缘解析只支持根据当前任务的 FlinkSQL 去解析,没有进行上下游串联,用户无法回溯或者下钻上下游关联字段。


体验优化说明:字段级血缘支持上下钻查询。(建议配合表级血缘一起分析,因为字段级血缘是纯 SQL 解析,不携带任务信息)

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user166259/article/feb6ca6e7ec6422328596ab5ba9102f7..jpg

(体验优化示意图)


2.数据还原 SINK 端表名生成逻辑优化

  体验优化说明  

背景:原先数据还原任务的 SINK 端表名生成,会自动拼接 Stream 等前缀。容易出现不符合内部数开的表名命名规则,拼接后导致表名太长无法正常创建等问题。


体验优化说明:SINK 端自动创建的表名,支持两种模式:默认和源表相同、支持在源表名的基础上拼接自定义内容。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user166259/article/8c7c9ffaf3dbfbb404141a5615a4f530..jpg

(体验优化示意图)


3.向导开发模式,Kafka 支持自动映射

  体验优化说明  

背景:之前实时平台的 FlinkSQL 任务开发,对于 Kafka Topic 的映射操作非常麻烦,需要用户查询 JSON 中的每个 KEY,配置成 Flink 表的字段,如果需要做上百个字段的映射,也需要人肉操作。开发往往选择在应用外想办法完成批量映射,再粘贴到平台内,交互比较差。


体验优化说明:Kafka Format 新增 OGG-JSON/ CHUNJUN-JSON,支持对这类 JSON 数据实现一键映射:

• 一键采集线上样例数据,自动完成映射

• 手动输入样例数据,一键完成映射

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user166259/article/bec5b275d7e326ea0e2414e7bf877f80..jpg

(体验优化示意图)


4.Checkpoint 语义优化

  体验优化说明  

背景:之前实时任务的 Checkpoint 恢复语义是放在环境参数中配置的(和开源 Flink 相同),但实际并不生效。因为 Flink 的实现是基于开源改造过的,状态恢复语义需要在任务的结果表中进行 semantic 参数配置。


体验优化说明:调整环境参数中的状态恢复语义提示文案,引导开发至结果表参数中配置。FlinkSQL 任务默认为 at-least-once(保障实时性)、数据还原任务默认为 exactly-once(保障准确性)。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user166259/article/eae9a5bdc218518f3eed1340a717a729..jpg

(体验优化示意图)

《数据治理行业实践白皮书》下载地址:https://fs80.cn/4w2atu

《数栈V6.0产品白皮书》下载地址:
https://fs80.cn/cw0iw1

想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:
https://www.dtstack.com/?src=bbs

同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:
https://github.com/DTStack

0条评论
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群