Hadoop

Hadoop

基于Hadoop大数据分析场景应用

网友分享数栈君 发表了文章 • 0 个评论 • 15 次浏览 • 2 天前 • 来自相关话题

一、Hadoop的应用业务分析大数据是不能用传统的计算技术处理的大型数据集的集合。它不是一个单一的技术或工具,而是涉及的业务和技术的许多领域。目前主流的三大分布式计算系统分别为Hadoop、Spark和Strom:Hadoop当前大数据管理标准之一,运用在当前... ...查看全部

Hadoop框架及HDFS详细概述

网友分享数栈君 发表了文章 • 0 个评论 • 15 次浏览 • 2 天前 • 来自相关话题

一、Hadoop1、分布式和集群    分布式: 分布式的主要工作是分解任务,将职能拆解,多个人在一起做不同的事    集群: 集群主要是将同一个业务,部署在多个服务器上 ,多个人在一起做同样的事2、Hadoop框架2.1 概述Hadoop简介:是Apache... ...查看全部

易知微的2024已打印完成

产品交流数栈君 发表了文章 • 0 个评论 • 15 次浏览 • 2 天前 • 来自相关话题

欢迎翻开我们的设计年鉴,本篇精选展示了我们 2024 年在数据可视化、数字孪生领域、产品体验设计、品牌运营设计上的新探索和成果。我们将会带您一起回顾:可视化 & 数字孪生设计在新行业的落地实践大屏模板/套件资源、可视化教学直播等内容设计可视化编辑器 E... ...查看全部

EasyV 2024 年度之“最”大揭秘

产品交流数栈君 发表了文章 • 0 个评论 • 13 次浏览 • 2 天前 • 来自相关话题

《数据资产管理白皮书》下载地址:https://www.dtstack.com/resources/1073/?src=bbs《行业指标体系白皮书》下载地址:https://www.dtstack.com/resources/1057/?src=bbs《数据治... ...查看全部

EasyTwin2024年度回顾 | 拥抱效率,让改变真正发生

产品交流数栈君 发表了文章 • 0 个评论 • 19 次浏览 • 2 天前 • 来自相关话题

《数据资产管理白皮书》下载地址:https://www.dtstack.com/resources/1073/?src=bbs《行业指标体系白皮书》下载地址:https://www.dtstack.com/resources/1057/?src=bbs《数据治... ...查看全部

Hadoop入门—HDFS、MR、Yarn

网友分享数栈君 发表了文章 • 0 个评论 • 13 次浏览 • 3 天前 • 来自相关话题

Hadoop简介狭义来说,hadoop是Apache基金会开发的分布式系统基础架构,用来解决海量数据的存储和海量数据的分析计算问题。广义上来说,Hadoop 通常是指一个更广泛的概念 —— Hadoop 生态圈。Hadoop 三大发行版本Apache、Clou... ...查看全部

Hadoop生态简介,Hive、Spark、HBase等

网友分享数栈君 发表了文章 • 0 个评论 • 24 次浏览 • 3 天前 • 来自相关话题

1. Hadoop1.1 Hadoop简介Hadoop现在已经是大数据领域事实上的标准,基本提到大数据,大家首先想到的就是Hadoop。在本文中,笔者会结合自己的实际使用经验,力求以简单易懂的语言讲清楚Hadoop及其衍生生态下各个组件产生的背景,以及它们之间... ...查看全部

一文搞懂Hadoop使用方法,大数据入门必备

网友分享数栈君 发表了文章 • 0 个评论 • 17 次浏览 • 4 天前 • 来自相关话题

一、Hadoop 是何方神圣?在当今数字化时代,数据呈爆炸式增长态势,如何高效地进行海量数据的存储与处理,已然成为企业及科研机构所面临的关键挑战。而 Hadoop,作为一款开源的分布式系统基础架构,在大数据领域那可是当之无愧的 “顶流”!Hadoop 的诞生,... ...查看全部

Hadoop:全面深入解析

网友分享数栈君 发表了文章 • 0 个评论 • 27 次浏览 • 4 天前 • 来自相关话题

   Hadoop是一个用于大规模数据处理的开源框架,其设计旨在通过集群的方式进行分布式存储和计算。本篇博文将从Hadoop的定义、架构、原理、应用场景以及常见命令等多个方面进行详细探讨,帮助读者全面深入地了解Hadoop。1. Hadoop的定义1.1 什么... ...查看全部

【Kafka】与【Hadoop】的集成应用案例深度解析

网友分享数栈君 发表了文章 • 0 个评论 • 33 次浏览 • 2025-01-17 10:25 • 来自相关话题

一、引言1、Kafka简介Apache Kafka 是一个分布式流处理平台,最初由 LinkedIn 开发,并于 2011 年开源,现在由 Apache Software Foundation 进行维护。Kafka 旨在提供一个统一、高吞吐量、低延迟的平台,用... ...查看全部

Dinky 扩展批流统一数据集成框架 ChunJun 的实践分享

ChunJun数栈君 发表了文章 • 0 个评论 • 1469 次浏览 • 2022-11-18 15:36 • 来自相关话题

一、前言ChunJun(原 FlinkX)是一个基于 Flink 提供易用、稳定、高效的批流统一的数据集成工具,既可以采集静态的数据,比如 MySQL,HDFS 等,也可以采集实时变化的数据,比如 binlog,Kafka 等。同时 ChunJun 也是一个支... ...查看全部

一文读懂什么是Hadoop?

技术共享花袋鼠 发表了文章 • 0 个评论 • 912 次浏览 • 2021-11-04 11:34 • 来自相关话题

01引言2011年的时候我们在百度搜索Hadoop相关的问题每天只有零星几个,2015年再去百度搜索Hadoop已经有800多万个问题,而如今已然已经过亿了,Hadoop已成为大数据必备的基础设施了。Hadoop被公认是一套行业大数据标准开源软件,在分布式环境... ...查看全部

大佬们,chunjun,yan-prejob 启动时 会报空,这是什么原因呢

回复

ChunJun匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 466 次浏览 • 2023-05-26 10:41 • 来自相关话题

有没有大佬遇到过 把chunjun-dist 放到 flink lib里面创建 iceberg的连接器失败,去掉就可以创建 ,版本1.16

回复

ChunJun匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 504 次浏览 • 2023-05-26 10:41 • 来自相关话题

问下大家 flink在提交任务后,在源端数据库会有一个进程

回复

ChunJun匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 484 次浏览 • 2023-05-26 10:40 • 来自相关话题

我修改了flink-json的源代码暂时绕过去了

回复

ChunJun群内解答 回复了问题 • 1 人关注 • 2 个回复 • 536 次浏览 • 2023-05-26 10:40 • 来自相关话题

请教各位大佬一个问题哈,目前chunjun支持postgresql数据库11版本备库实时数据同步吗?

回复

ChunJun匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 477 次浏览 • 2023-05-26 10:38 • 来自相关话题

啥时候能把flink cdc的版本提升呀

回复

ChunJun群内解答 回复了问题 • 1 人关注 • 2 个回复 • 511 次浏览 • 2023-05-26 10:29 • 来自相关话题

1.13 和1.16的 json包结构发生了变化;mapper对象修改了不在构造方法中创建了;

回复

ChunJun群内解答 回复了问题 • 1 人关注 • 1 个回复 • 597 次浏览 • 2023-05-26 10:28 • 来自相关话题

有大佬遇到过这个问题吗?使用docker镜像进行ES数据同步,

回复

ChunJun匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 460 次浏览 • 2023-05-26 10:27 • 来自相关话题

基于Hadoop大数据分析场景应用

网友分享数栈君 发表了文章 • 0 个评论 • 15 次浏览 • 2 天前 • 来自相关话题

一、Hadoop的应用业务分析大数据是不能用传统的计算技术处理的大型数据集的集合。它不是一个单一的技术或工具,而是涉及的业务和技术的许多领域。目前主流的三大分布式计算系统分别为Hadoop、Spark和Strom:Hadoop当前大数据管理标准之一,运用在当前... ...查看全部

Hadoop框架及HDFS详细概述

网友分享数栈君 发表了文章 • 0 个评论 • 15 次浏览 • 2 天前 • 来自相关话题

一、Hadoop1、分布式和集群    分布式: 分布式的主要工作是分解任务,将职能拆解,多个人在一起做不同的事    集群: 集群主要是将同一个业务,部署在多个服务器上 ,多个人在一起做同样的事2、Hadoop框架2.1 概述Hadoop简介:是Apache... ...查看全部

易知微的2024已打印完成

产品交流数栈君 发表了文章 • 0 个评论 • 15 次浏览 • 2 天前 • 来自相关话题

欢迎翻开我们的设计年鉴,本篇精选展示了我们 2024 年在数据可视化、数字孪生领域、产品体验设计、品牌运营设计上的新探索和成果。我们将会带您一起回顾:可视化 & 数字孪生设计在新行业的落地实践大屏模板/套件资源、可视化教学直播等内容设计可视化编辑器 E... ...查看全部

EasyV 2024 年度之“最”大揭秘

产品交流数栈君 发表了文章 • 0 个评论 • 13 次浏览 • 2 天前 • 来自相关话题

《数据资产管理白皮书》下载地址:https://www.dtstack.com/resources/1073/?src=bbs《行业指标体系白皮书》下载地址:https://www.dtstack.com/resources/1057/?src=bbs《数据治... ...查看全部

EasyTwin2024年度回顾 | 拥抱效率,让改变真正发生

产品交流数栈君 发表了文章 • 0 个评论 • 19 次浏览 • 2 天前 • 来自相关话题

《数据资产管理白皮书》下载地址:https://www.dtstack.com/resources/1073/?src=bbs《行业指标体系白皮书》下载地址:https://www.dtstack.com/resources/1057/?src=bbs《数据治... ...查看全部

Hadoop入门—HDFS、MR、Yarn

网友分享数栈君 发表了文章 • 0 个评论 • 13 次浏览 • 3 天前 • 来自相关话题

Hadoop简介狭义来说,hadoop是Apache基金会开发的分布式系统基础架构,用来解决海量数据的存储和海量数据的分析计算问题。广义上来说,Hadoop 通常是指一个更广泛的概念 —— Hadoop 生态圈。Hadoop 三大发行版本Apache、Clou... ...查看全部

Hadoop生态简介,Hive、Spark、HBase等

网友分享数栈君 发表了文章 • 0 个评论 • 24 次浏览 • 3 天前 • 来自相关话题

1. Hadoop1.1 Hadoop简介Hadoop现在已经是大数据领域事实上的标准,基本提到大数据,大家首先想到的就是Hadoop。在本文中,笔者会结合自己的实际使用经验,力求以简单易懂的语言讲清楚Hadoop及其衍生生态下各个组件产生的背景,以及它们之间... ...查看全部

一文搞懂Hadoop使用方法,大数据入门必备

网友分享数栈君 发表了文章 • 0 个评论 • 17 次浏览 • 4 天前 • 来自相关话题

一、Hadoop 是何方神圣?在当今数字化时代,数据呈爆炸式增长态势,如何高效地进行海量数据的存储与处理,已然成为企业及科研机构所面临的关键挑战。而 Hadoop,作为一款开源的分布式系统基础架构,在大数据领域那可是当之无愧的 “顶流”!Hadoop 的诞生,... ...查看全部

Hadoop:全面深入解析

网友分享数栈君 发表了文章 • 0 个评论 • 27 次浏览 • 4 天前 • 来自相关话题

   Hadoop是一个用于大规模数据处理的开源框架,其设计旨在通过集群的方式进行分布式存储和计算。本篇博文将从Hadoop的定义、架构、原理、应用场景以及常见命令等多个方面进行详细探讨,帮助读者全面深入地了解Hadoop。1. Hadoop的定义1.1 什么... ...查看全部

【Kafka】与【Hadoop】的集成应用案例深度解析

网友分享数栈君 发表了文章 • 0 个评论 • 33 次浏览 • 2025-01-17 10:25 • 来自相关话题

一、引言1、Kafka简介Apache Kafka 是一个分布式流处理平台,最初由 LinkedIn 开发,并于 2011 年开源,现在由 Apache Software Foundation 进行维护。Kafka 旨在提供一个统一、高吞吐量、低延迟的平台,用... ...查看全部