Spark

Spark

Hadoop与Spark集成应用研究

知识百科数栈君 发表了文章 • 0 个评论 • 22 次浏览 • 2024-03-07 11:15 • 来自相关话题

集成Spark与Kudu:提升大规模数据分析效率

知识百科数栈君 发表了文章 • 0 个评论 • 23 次浏览 • 2024-03-04 10:50 • 来自相关话题

通过Hive与Spark SQL整合提升离线计算效率

知识百科数栈君 发表了文章 • 0 个评论 • 32 次浏览 • 2024-02-29 10:27 • 来自相关话题

引言: 随着大数据时代的到来,离线计算在企业级数据分析与决策支持中占据着举足轻重的地位。Apache Hive作为一款基于Hadoop的数据仓库工具,以其SQL-like查询语言和强大的数据管理功能深受广大用户青睐。与此同时,Apache Spark SQL作... ...查看全部

Hive与Spark集成:提升大数据处理性能的关键技术

知识百科数栈君 发表了文章 • 0 个评论 • 25 次浏览 • 2024-02-26 13:56 • 来自相关话题

最新版Flink CDC MySQL同步MySQL

网友分享数栈君 发表了文章 • 0 个评论 • 77 次浏览 • 2024-02-05 10:17 • 来自相关话题

1.概述Flink CDC 是Apache Flink ®的一组源连接器,使用变更数据捕获 (CDC) 从不同数据库中获取变更。Apache Flink 的 CDC Connectors集成 Debezium 作为捕获数据更改的引擎。所以它可以充分发挥 Deb... ...查看全部

Spark大数据分析与实战笔记

知识百科数栈君 发表了文章 • 0 个评论 • 57 次浏览 • 2024-02-05 10:15 • 来自相关话题

Spark 底层执行原理

知识百科数栈君 发表了文章 • 0 个评论 • 52 次浏览 • 2024-01-18 10:13 • 来自相关话题

SortShuffle 解析

知识百科数栈君 发表了文章 • 0 个评论 • 43 次浏览 • 2024-01-18 10:12 • 来自相关话题

Hash Shuffle 解析

知识百科数栈君 发表了文章 • 0 个评论 • 53 次浏览 • 2024-01-17 10:44 • 来自相关话题

Structured Streaming应用场景

知识百科数栈君 发表了文章 • 0 个评论 • 73 次浏览 • 2024-01-17 10:42 • 来自相关话题

袋鼠云的数据湖解决方案选型的是那个框架?Hudi、Iceberg还是Delta Lake

数据中台群内解答 回复了问题 • 1 人关注 • 1 个回复 • 578 次浏览 • 2022-12-21 14:06 • 来自相关话题

大佬们,chunjun,yan-prejob 启动时 会报空,这是什么原因呢

回复

ChunJun匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 204 次浏览 • 2023-05-26 10:41 • 来自相关话题

有没有大佬遇到过 把chunjun-dist 放到 flink lib里面创建 iceberg的连接器失败,去掉就可以创建 ,版本1.16

回复

ChunJun匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 204 次浏览 • 2023-05-26 10:41 • 来自相关话题

问下大家 flink在提交任务后,在源端数据库会有一个进程

回复

ChunJun匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 207 次浏览 • 2023-05-26 10:40 • 来自相关话题

我修改了flink-json的源代码暂时绕过去了

回复

ChunJun群内解答 回复了问题 • 1 人关注 • 2 个回复 • 235 次浏览 • 2023-05-26 10:40 • 来自相关话题

请教各位大佬一个问题哈,目前chunjun支持postgresql数据库11版本备库实时数据同步吗?

回复

ChunJun匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 205 次浏览 • 2023-05-26 10:38 • 来自相关话题

啥时候能把flink cdc的版本提升呀

回复

ChunJun群内解答 回复了问题 • 1 人关注 • 2 个回复 • 225 次浏览 • 2023-05-26 10:29 • 来自相关话题

1.13 和1.16的 json包结构发生了变化;mapper对象修改了不在构造方法中创建了;

回复

ChunJun群内解答 回复了问题 • 1 人关注 • 1 个回复 • 259 次浏览 • 2023-05-26 10:28 • 来自相关话题

有大佬遇到过这个问题吗?使用docker镜像进行ES数据同步,

回复

ChunJun匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 177 次浏览 • 2023-05-26 10:27 • 来自相关话题

Hadoop与Spark集成应用研究

知识百科数栈君 发表了文章 • 0 个评论 • 22 次浏览 • 2024-03-07 11:15 • 来自相关话题

集成Spark与Kudu:提升大规模数据分析效率

知识百科数栈君 发表了文章 • 0 个评论 • 23 次浏览 • 2024-03-04 10:50 • 来自相关话题

通过Hive与Spark SQL整合提升离线计算效率

知识百科数栈君 发表了文章 • 0 个评论 • 32 次浏览 • 2024-02-29 10:27 • 来自相关话题

引言: 随着大数据时代的到来,离线计算在企业级数据分析与决策支持中占据着举足轻重的地位。Apache Hive作为一款基于Hadoop的数据仓库工具,以其SQL-like查询语言和强大的数据管理功能深受广大用户青睐。与此同时,Apache Spark SQL作... ...查看全部

Hive与Spark集成:提升大数据处理性能的关键技术

知识百科数栈君 发表了文章 • 0 个评论 • 25 次浏览 • 2024-02-26 13:56 • 来自相关话题

最新版Flink CDC MySQL同步MySQL

网友分享数栈君 发表了文章 • 0 个评论 • 77 次浏览 • 2024-02-05 10:17 • 来自相关话题

1.概述Flink CDC 是Apache Flink ®的一组源连接器,使用变更数据捕获 (CDC) 从不同数据库中获取变更。Apache Flink 的 CDC Connectors集成 Debezium 作为捕获数据更改的引擎。所以它可以充分发挥 Deb... ...查看全部

Spark大数据分析与实战笔记

知识百科数栈君 发表了文章 • 0 个评论 • 57 次浏览 • 2024-02-05 10:15 • 来自相关话题

Spark 底层执行原理

知识百科数栈君 发表了文章 • 0 个评论 • 52 次浏览 • 2024-01-18 10:13 • 来自相关话题

SortShuffle 解析

知识百科数栈君 发表了文章 • 0 个评论 • 43 次浏览 • 2024-01-18 10:12 • 来自相关话题

Hash Shuffle 解析

知识百科数栈君 发表了文章 • 0 个评论 • 53 次浏览 • 2024-01-17 10:44 • 来自相关话题

Structured Streaming应用场景

知识百科数栈君 发表了文章 • 0 个评论 • 73 次浏览 • 2024-01-17 10:42 • 来自相关话题