大数据开源

大数据开源

麻烦问下最新的chunjun代码里没有chunjun通用配置详解这个文件了,这块文档是废弃了吗

ChunJun群内解答 回复了问题 • 1 人关注 • 1 个回复 • 11 次浏览 • 22 小时前 • 来自相关话题

请问taier本地调试要怎么操作啊,有相关的文档吗?

回复

Taier匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 12 次浏览 • 22 小时前 • 来自相关话题

Chunjun提供了哪些类型的catalog? 支持kafka json么?

ChunJun群内解答 回复了问题 • 1 人关注 • 5 个回复 • 12 次浏览 • 22 小时前 • 来自相关话题

chunjun在mysql 同步中,customSql和transformSql有什么区别?

ChunJun群内解答 回复了问题 • 1 人关注 • 2 个回复 • 10 次浏览 • 22 小时前 • 来自相关话题

iceberg sql这个问题有人遇到过吗

ChunJun群内解答 回复了问题 • 1 人关注 • 1 个回复 • 9 次浏览 • 22 小时前 • 来自相关话题

数据治理做得早,数据底座质量牢

网友分享数栈君 发表了文章 • 0 个评论 • 10 次浏览 • 3 天前 • 来自相关话题

数据质量管理包含正确定义数据标准,并采用正确的技术、投入合理的资源来管理数据质量。数据质量管理策略和技术的应用是一个比较广泛的范畴,它可以作用于数据质量管理的事前、事中、事后三个阶段。数据质量管理应秉持预防为主的理念,坚持将“以预控为核心,以满足业务需求为目标... ...查看全部

昨天下载了源码,这个总是不成功,有人遇到过吗?请高人指点一下

回复

Taier匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 12 次浏览 • 4 天前 • 来自相关话题

条新动态, 点击查看
这部分官网上是有的,你再仔细找找想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=bbs同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新... 显示全部 »
这部分官网上是有的,你再仔细找找想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=bbs同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:https://github.com/DTStack/chunjun  

ChunJun 顺利晋级“2022 年中国开源创新大赛”决赛,并荣获“优秀开源项目/社区”奖项

ChunJun数栈君 发表了文章 • 0 个评论 • 23 次浏览 • 6 天前 • 来自相关话题

日前,“2022年中国开源创新大赛”初赛晋级名单公布,易用、稳定、高效的批流统一的数据集成框架 ChunJun 顺利晋级决赛,并荣获“2022年中国开源创新大赛优秀开源项目/社区”奖项。感谢组委会专家的认可,ChunJun也将继续秉承技术初心,砥砺前行,不遗余... ...查看全部

一看就懂!任务提交的资源判断在Taier中的实践

Taier小美 发表了文章 • 0 个评论 • 48 次浏览 • 2023-02-01 10:17 • 来自相关话题

Taier 介绍Taier 是袋鼠云开源项目之一,是一个分布式可视化的DAG任务调度系统。旨在降低ETL开发成本、提高大数据平台稳定性,大数据开发人员可以在 Taier 直接进行业务逻辑的开发,而不用关心任务错综复杂的依赖关系与底层的大数据平台的架构实现,将工... ...查看全部

袋鼠云基于Calcite框架的SQL语法扩展探索

技术共享数栈君 发表了文章 • 0 个评论 • 103 次浏览 • 2023-01-16 16:47 • 来自相关话题

Calcite在大数据系统中有着广泛的运用, 比如Apache Flink, Apache Drill等都大量使用了Calcite,理解Calcite的原理可以说已经成为理解大数据系统中SQL访问层实现原理的必备条件之一。但是不少人在学习Calcite的过程中... ...查看全部

基于数据中台的大数据治理,数字化运营组织

技术共享数栈君 发表了文章 • 0 个评论 • 86 次浏览 • 2023-01-13 10:09 • 来自相关话题

1在互联网企业,业务和数据团队是无缝衔接的。本身互联网企业的业务运营对技术和数据就是极度的依赖,所以业务的同学对技术和数据具有天生的敏感性。基于这个前提,业务团队对数据团也是非常直接的喊着“要、要、要”。在这样的场景下,说明业务团队能够明确地提出数据需求,且数... ...查看全部

大数据开源讲解:基于Apache Calcite框架的SQL语法扩展探索

技术共享数栈君 发表了文章 • 0 个评论 • 123 次浏览 • 2023-01-12 16:36 • 来自相关话题

Calcite在大数据系统中有着广泛的运用, 比如Apache Flink, Apache Drill等都大量使用了Calcite,理解Calcite的原理可以说已经成为理解大数据系统中SQL访问层实现原理的必备条件之一。但是不少人在学习Calcite的过程中... ...查看全部

DAG任务调度系统 Taier 演进之道,探究DataSourceX 模块

Taier数栈君 发表了文章 • 0 个评论 • 79 次浏览 • 2022-12-28 13:41 • 来自相关话题

熟悉Taier的小伙伴们应该都知道,在11月7日发布的Taier1.3新版本中,我们融合了「DataSourceX 模块」。这是十分重要的一个变化,移除Taier外部插件依赖,新增数据源插件相关特性,支持后续Taier对接更多的RDBMS类型的SQL任务。本篇... ...查看全部

袋鼠云大数据基础平台EasyMR正式上线,助力企业构建便捷、智能、高效的“数据底座”

产品交流数栈君 发表了文章 • 0 个评论 • 193 次浏览 • 2022-12-08 14:14 • 来自相关话题

7月28日,在袋鼠云2022产品发布会上,袋鼠云技术负责人思枢正式宣布旗下产品「大数据基础平台EasyMR」发布。EasyMR是袋鼠云自研的大数据基础平台,提供Hadoop、Hive、Spark、Trino、HBase、Kafka等组件,完全兼容Apache开... ...查看全部

chengying组件已经部署好了,现在加服务器了,想把组件里面的某个服务扩展,需要把这个组件里面的所有服务都重新部署吗

ChengYing群内解答 回复了问题 • 1 人关注 • 1 个回复 • 134 次浏览 • 2022-12-01 19:55 • 来自相关话题

致谢每一位ChunJun Contributor!这里有一份礼物等你领取!

ChunJun数栈君 发表了文章 • 0 个评论 • 150 次浏览 • 2022-11-15 15:05 • 来自相关话题

作为一个批流统一的数据集成框架,秉承着易用、稳定、高效的目标,ChunJun于2018年4月29日在Github上将内核源码正式开放。从还被叫作FlinkX,写下第一行代码开始,ChunJun已经走过了第六个年头,经历了从分布式离线/实时数据同步插件,晋级为批... ...查看全部

麻烦问下最新的chunjun代码里没有chunjun通用配置详解这个文件了,这块文档是废弃了吗

回复

ChunJun群内解答 回复了问题 • 1 人关注 • 1 个回复 • 11 次浏览 • 22 小时前 • 来自相关话题

请问taier本地调试要怎么操作啊,有相关的文档吗?

回复

Taier匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 12 次浏览 • 22 小时前 • 来自相关话题

Chunjun提供了哪些类型的catalog? 支持kafka json么?

回复

ChunJun群内解答 回复了问题 • 1 人关注 • 5 个回复 • 12 次浏览 • 22 小时前 • 来自相关话题

chunjun在mysql 同步中,customSql和transformSql有什么区别?

回复

ChunJun群内解答 回复了问题 • 1 人关注 • 2 个回复 • 10 次浏览 • 22 小时前 • 来自相关话题

iceberg sql这个问题有人遇到过吗

回复

ChunJun群内解答 回复了问题 • 1 人关注 • 1 个回复 • 9 次浏览 • 22 小时前 • 来自相关话题

昨天下载了源码,这个总是不成功,有人遇到过吗?请高人指点一下

回复

Taier匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 12 次浏览 • 4 天前 • 来自相关话题

这个是什么问题呀?这玩意每天晚上扫描整个磁盘建索引

回复

Taier匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 14 次浏览 • 4 天前 • 来自相关话题

数据治理做得早,数据底座质量牢

网友分享数栈君 发表了文章 • 0 个评论 • 10 次浏览 • 3 天前 • 来自相关话题

数据质量管理包含正确定义数据标准,并采用正确的技术、投入合理的资源来管理数据质量。数据质量管理策略和技术的应用是一个比较广泛的范畴,它可以作用于数据质量管理的事前、事中、事后三个阶段。数据质量管理应秉持预防为主的理念,坚持将“以预控为核心,以满足业务需求为目标... ...查看全部

数据湖哪家服务好

知识百科数栈君 发表了文章 • 0 个评论 • 6 次浏览 • 4 天前 • 来自相关话题

利好信息不断,国产基础软件的变局到了吗?

知识百科数栈君 发表了文章 • 0 个评论 • 5 次浏览 • 4 天前 • 来自相关话题

ChunJun 顺利晋级“2022 年中国开源创新大赛”决赛,并荣获“优秀开源项目/社区”奖项

ChunJun数栈君 发表了文章 • 0 个评论 • 23 次浏览 • 6 天前 • 来自相关话题

日前,“2022年中国开源创新大赛”初赛晋级名单公布,易用、稳定、高效的批流统一的数据集成框架 ChunJun 顺利晋级决赛,并荣获“2022年中国开源创新大赛优秀开源项目/社区”奖项。感谢组委会专家的认可,ChunJun也将继续秉承技术初心,砥砺前行,不遗余... ...查看全部

一文搞懂数据仓库、数据平台、数据中台、数据湖的概念和区别

网友分享数栈君 发表了文章 • 0 个评论 • 26 次浏览 • 2023-03-07 10:04 • 来自相关话题

我们经常听到别人谈论数据仓库、数据平台、数据中台、数据湖的相关概念,它们都与数据有关系,但它们之间又有什么区别,下面将围绕数据仓库、数据平台、数据湖和数据中台的概念、架构、使用场景进行介绍。一、数据仓库1. 数据仓库概念数据仓库由比尔·恩门(Bill Inmo... ...查看全部

终于有人把数据湖说明白了

知识百科数栈君 发表了文章 • 0 个评论 • 19 次浏览 • 2023-03-07 10:02 • 来自相关话题

作为全局数据汇总及处理的核心功能,数据湖在数据中台建设中必不可少。那么它与数据仓库、数据中台是什么关系?下图显示了一个典型的从数据采集到数据湖、数据仓库及数据集市,最后为数据应用提供服务的流程。可以看到,除了为数据仓库提供原始数据之外,数据湖也可以直接为上层的... ...查看全部

你的数据中台,可能建错了!

知识百科数栈君 发表了文章 • 0 个评论 • 22 次浏览 • 2023-03-06 14:21 • 来自相关话题

由于不同行业、不同企业的发展程度存在差异,因此会导致不同企业的数据中台的建设起点不同。虽然起点存在差异,但是数据中台的建设应该是一个不断迭代和优化的过程,没有终点。目前,行业对数据中台存在诸多误解和理解偏差,因此在建设数据中台的过程中,错误的理解可能导致数据中... ...查看全部

一文读懂数据中台!附5大行业解决方案架构图

网友分享数栈君 发表了文章 • 0 个评论 • 21 次浏览 • 2023-03-06 14:19 • 来自相关话题

一、解码数据中台01:解码数据中台与许多新概念诞生之初的境遇一样,数据中台目前正处于“定义混乱期”。有人认为数据中台是云平台的一部分,同时包括业务中台和技术中台;有人认为数据中台是数据的共享、整合和深度分析;还有人认为数据中台是“计算平台+算法模型+智能硬件”... ...查看全部

什么是数据中台?数据中台的特点是什么?

知识百科数栈君 发表了文章 • 0 个评论 • 16 次浏览 • 2023-03-06 11:50 • 来自相关话题

—01—数据中台定义 数据中台是一种将企业沉睡的数据变成数据资产,持续使用数据、产生智能、为业务服务,从而实现数据价值变现的系统和机制。 通过数据中台提供的方法和运行机制,形成汇聚整合、提纯加工、建模处理、算法学习,并以共享服务的方式将数据提供给业务使用,从而... ...查看全部

袋鼠云数栈前端框架Antd 3.x 升级 4.x 的踩坑之路

产品交流数栈君 发表了文章 • 0 个评论 • 18 次浏览 • 2023-03-03 12:01 • 来自相关话题

袋鼠云数栈从2016年发布第⼀个版本开始,就始终坚持着以技术为核⼼、安全为底线、提效为⽬标、中台为战略的思想,坚定不移地⾛国产化信创路线,不断推进产品功能迭代、技术创新、服务细化和性能升级。在数栈过去的产品迭代中受限于当前组件的版本,积累了很多待解决的问题,随... ...查看全部