新增功能更新
1.数据开发 SQL Query 支持 streaming、batch 模式选择
新增功能说明
背景:此前只支持 streaming 模式。
新增功能说明:针对 FlinkSQL 任务(1.16),任务设置中支持 Query 执行设置,可选择执行方式为流模式或者批模式。
「Stream 模式」
• 定义:任务以流模式查数据
• 查询时长:将任务开始在 Flink 引擎上执行,作为计算起点,当查询时间达到此处设置上限时自动停止查询
• 结果最大显示条数:当查询到的数据条数满足设置值时,数据总量不再增加,新的数据覆盖最早的数据
「Batch 模式」
• 定义:任务以批模式查数据,数据查完后暂存,一次性返回至平台展示,支持结果下载,下载功能同 stream 模式
• 查询时长:查询时间达到此处设置上限时自动停止查询,若在此时间内数据返回结束则打印结果,否则结果为空
• 结果最大显示条数:查询/下载结果上限为此处设置的条数
(新增功能示意图)
2.数据开发 kafka 格式新增 attunity json
新增功能说明
3.实时采集向导模式结果端支持 gp
新增功能说明
4.FlinkSQL 维表支持 OceanBase
新增功能说明
5.实时湖仓通过后端文件配置控制湖表的展示和其他操作
新增功能说明
背景:用户对实时湖仓表管理中表的范围提出需求,此前实时湖仓不支持展示在其他平台或底层创建的表,并需要对表的增删改查操作设置权限限制。
新增功能说明:
• 优化实时湖仓获取 HMScatalog 元数据的方式
• 通过配置项参数,控制 IED 编辑 SQL 和湖仓管理-表展示的范围、控制表操作的范围,当前配置项仅针对 HSMCatalog
• 优化表管理 Catalog 展示性能问题
6.实时湖仓 HMSCatalog 创建增加 Warehouse 参数
新增功能说明
7.版本适配和支持
新增功能说明
8.数据开发页面支持高级检索方式
新增功能说明
9.FlinkSQL&实时采集向导模式增加脚本预览功能
新增功能说明
10.字段自动补全功能
新增功能说明
11.适配 kafka3 且支持 kerberos 认证
新增功能说明
功能优化
1.任务运维实时任务并行度修改的热更新
体验优化说明
2.任务运维任务支持跳转 FlinkUI
体验优化说明
3.数据开发任务锁覆盖逻辑优化
体验优化说明
4.任务运维血缘节点信息优化
体验优化说明
5.实时开发选择资源时,直接根据任务类型限制能选择的资源类型范围
体验优化说明
背景:需要通过资源创建的任务类型,在创建时应有校验资源类型是否选择正确的功能,而不是在选择资源时直接根据当前任务类型进行可选资源范围过滤,导致错误提示滞后,增加用户误操作成本。
体验优化说明:选择资源时直接根据任务类型限制可选范围,其余不可选的资源类型在下拉时置灰无法选中
• Flink 可选范围为 jar
• PyFlink 可选范围为 py 文件
6.任务信息清理
体验优化说明
背景:
• 某个任务由于业务变更需要修改逻辑或在较长的一段时间内不需要执行时,在任务运维列表中还持续存在会造成信息干扰,需要进行下线操作,和提交形成逆向的操作闭环
• 任务下线后可能隔断时间会重新提交,也可能很长一段时间内不会再次提交,目前所有任务的 cp sp 信息都保留会导致无用文件的堆积,任务删除时任务相关的信息更需要完整删除
• on k8s 的任务在 jobgraph 创建之前被取消或异常失败不会被清理,只有在正常结束或者 jobgraph 调度之后再被取消才会正常清理;on yarn 的任务,如果任务 cancel 会删除数据,但是如果直接 kill application 则不会删除 zk 数据,同样会导致无用文件的堆积
体验优化说明:
• 实时开发任务下线后可选择清理 check point、save point 信息,任务异常状态时清理 zk 信息
• 任务下线时可选择清理运维记录及日志数据,任务删除时自动删除运维记录及日志数据
7.健康分优化
体验优化说明
8.前端改造
体验优化说明
• 将 React Router 从 v3.x 升级到 v6.x
• 对前端易用性性能进行改造,改进首屏性能,通过易测做量化,改进 FPS 场景任务
9.向导模式下 AS 别名隐藏
体验优化说明
10.实时开发任务热更新优化
体验优化说明
11.自定义模版创建任务时取消引擎版本限制
体验优化说明
12.任务开发页面优化
体验优化说明
《行业指标体系白皮书》下载地址:https://www.dtstack.com/resources/1057/?src=bbs
《数据治理行业实践白皮书》下载地址:https://www.dtstack.com/resources/1001/?src=bbs
《数栈V6.0产品白皮书》下载地址:https://www.dtstack.com/resources/1004/?src=bbs
想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=bbs
同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:https://github.com/DTStack