Spark架构设计

Spark架构设计

Hadoop生态简介,Hive、Spark、HBase等

网友分享数栈君 发表了文章 • 0 个评论 • 181 次浏览 • 2025-01-22 14:05 • 来自相关话题

1. Hadoop1.1 Hadoop简介Hadoop现在已经是大数据领域事实上的标准,基本提到大数据,大家首先想到的就是Hadoop。在本文中,笔者会结合自己的实际使用经验,力求以简单易懂的语言讲清楚Hadoop及其衍生生态下各个组件产生的背景,以及它们之间... ...查看全部

Spark内置函数:字符串、日期和时间函数、聚合函数、数值函数、条件判断函数、窗口函数

技术共享数栈君 发表了文章 • 0 个评论 • 597 次浏览 • 2024-11-01 11:42 • 来自相关话题

1.1 字符串concat(col1,col2,......):连接多个字符串列。例如:concat(‘Hello’, ’ ‘, ‘World’)将返回’Hello World’。substring(col,start,length):从给定字符串列中提取子字... ...查看全部

Spark 对接 Alluxio

技术共享数栈君 发表了文章 • 0 个评论 • 585 次浏览 • 2024-07-31 15:23 • 来自相关话题

1、概览        Spark 1.1 或更高版本的 Spark可以通过其与 HDFS 兼容的接口直接访问 Alluxio 集群。 使用 Alluxio 作为数据访问层,Spark 应用程序可以透明地访问许多不同类型的持久化存储服务(例如,AWS S3 b... ...查看全部

SpringCloud-实现基于RabbitMQ的消息队列

网友分享数栈君 发表了文章 • 0 个评论 • 400 次浏览 • 2024-07-24 14:15 • 来自相关话题

消息队列是现代分布式系统中常用的通信机制,用于在不同的服务之间传递消息。在Spring Cloud框架中,我们可以利用RabbitMQ实现强大而可靠的消息队列系统。本篇博客将详细介绍如何在Spring Cloud项目中集成RabbitMQ,并创建一个简单的消息... ...查看全部

Spark SQL函数

网友分享数栈君 发表了文章 • 0 个评论 • 426 次浏览 • 2024-07-24 14:11 • 来自相关话题

内置函数 Spark SQL内置了大量的函数,位于API org.apache.spark.sql.functions中。其中大部分函数与Hive中的相同。 使用内置函数有两种方式:一种是通过编程的方式使用;另一种是在SQL语句中使用。- 以编... ...查看全部

大数据揭秘:Spark如何加速数据分析进程

知识百科数栈君 发表了文章 • 0 个评论 • 407 次浏览 • 2024-05-14 16:47 • 来自相关话题

一文理解Spark的基本概念和工作原理

网友分享数栈君 发表了文章 • 0 个评论 • 629 次浏览 • 2024-04-12 10:53 • 来自相关话题

在Hadoop 1.x版本中,采用的是MRv1版本的MapReduce编程模型,包括3个部分:运行时环境(JobTracker和TaskTracker)、编程模型(MapReduce)、数据处理引擎(MapTask和ReduceTask)。但是MRv1存在以下... ...查看全部

Hadoop与Spark集成应用研究

知识百科数栈君 发表了文章 • 0 个评论 • 322 次浏览 • 2024-03-07 11:15 • 来自相关话题

Flink和Spark技术的发展方向

知识百科数栈君 发表了文章 • 0 个评论 • 342 次浏览 • 2024-01-08 10:16 • 来自相关话题

Flink和Spark的引擎技术对比

知识百科数栈君 发表了文章 • 0 个评论 • 344 次浏览 • 2024-01-08 10:16 • 来自相关话题

Hadoop生态简介,Hive、Spark、HBase等

网友分享数栈君 发表了文章 • 0 个评论 • 181 次浏览 • 2025-01-22 14:05 • 来自相关话题

1. Hadoop1.1 Hadoop简介Hadoop现在已经是大数据领域事实上的标准,基本提到大数据,大家首先想到的就是Hadoop。在本文中,笔者会结合自己的实际使用经验,力求以简单易懂的语言讲清楚Hadoop及其衍生生态下各个组件产生的背景,以及它们之间... ...查看全部

Spark内置函数:字符串、日期和时间函数、聚合函数、数值函数、条件判断函数、窗口函数

技术共享数栈君 发表了文章 • 0 个评论 • 597 次浏览 • 2024-11-01 11:42 • 来自相关话题

1.1 字符串concat(col1,col2,......):连接多个字符串列。例如:concat(‘Hello’, ’ ‘, ‘World’)将返回’Hello World’。substring(col,start,length):从给定字符串列中提取子字... ...查看全部

Spark 对接 Alluxio

技术共享数栈君 发表了文章 • 0 个评论 • 585 次浏览 • 2024-07-31 15:23 • 来自相关话题

1、概览        Spark 1.1 或更高版本的 Spark可以通过其与 HDFS 兼容的接口直接访问 Alluxio 集群。 使用 Alluxio 作为数据访问层,Spark 应用程序可以透明地访问许多不同类型的持久化存储服务(例如,AWS S3 b... ...查看全部

SpringCloud-实现基于RabbitMQ的消息队列

网友分享数栈君 发表了文章 • 0 个评论 • 400 次浏览 • 2024-07-24 14:15 • 来自相关话题

消息队列是现代分布式系统中常用的通信机制,用于在不同的服务之间传递消息。在Spring Cloud框架中,我们可以利用RabbitMQ实现强大而可靠的消息队列系统。本篇博客将详细介绍如何在Spring Cloud项目中集成RabbitMQ,并创建一个简单的消息... ...查看全部

Spark SQL函数

网友分享数栈君 发表了文章 • 0 个评论 • 426 次浏览 • 2024-07-24 14:11 • 来自相关话题

内置函数 Spark SQL内置了大量的函数,位于API org.apache.spark.sql.functions中。其中大部分函数与Hive中的相同。 使用内置函数有两种方式:一种是通过编程的方式使用;另一种是在SQL语句中使用。- 以编... ...查看全部

大数据揭秘:Spark如何加速数据分析进程

知识百科数栈君 发表了文章 • 0 个评论 • 407 次浏览 • 2024-05-14 16:47 • 来自相关话题

一文理解Spark的基本概念和工作原理

网友分享数栈君 发表了文章 • 0 个评论 • 629 次浏览 • 2024-04-12 10:53 • 来自相关话题

在Hadoop 1.x版本中,采用的是MRv1版本的MapReduce编程模型,包括3个部分:运行时环境(JobTracker和TaskTracker)、编程模型(MapReduce)、数据处理引擎(MapTask和ReduceTask)。但是MRv1存在以下... ...查看全部

Hadoop与Spark集成应用研究

知识百科数栈君 发表了文章 • 0 个评论 • 322 次浏览 • 2024-03-07 11:15 • 来自相关话题

Flink和Spark技术的发展方向

知识百科数栈君 发表了文章 • 0 个评论 • 342 次浏览 • 2024-01-08 10:16 • 来自相关话题

Flink和Spark的引擎技术对比

知识百科数栈君 发表了文章 • 0 个评论 • 344 次浏览 • 2024-01-08 10:16 • 来自相关话题