Hive 核心知识点

1、请谈一下 Hive 的特点        hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的 sql 查询功能,可以将 sql 语句转换为MapReduce 任务进行运行。        其优点是学习...

   数栈君  发表于2024-12-24 16:04  357  0

Java核心 - 泛型详解

一、概述1、什么是泛型是在定义类、接口和方法时,可以在声明时通过一定的格式指定其参数类型。使用时再指定具体的类型,从而使得类、接口和方法可以被多种类型的数据所实例化或调用。这种可以在编译时进行参数类型检查的技术被称为泛型,是JDK5中引入的一个新特性。本质是参...

   数栈君  发表于2024-12-24 16:01  181  0

Hive SQL综合案例(下)

二、求单月访问次数和总访问次数1、数据说明数据字段说明用户名,月份,访问次数数据格式 A,2015-01,5A,2015-01,15B,2015-01,5A,2015-01,8B,2015-01,25A,2015-01,5A,2015-02,4A,2015-0...

   数栈君  发表于2024-12-23 11:22  254  0

从5天到1天,金隅集团的数智化历程经历了什么?

“只有决策快、公司运营快之后,公司才能实现降本增效”。从北京到新疆、从中国到南非,从奥运会场馆的水泥混凝土到钱塘江畔拔地而起的高楼房产,无不存在着某大型国有集团的身影。历经60多年沧桑巨变,该集团已发展成为以“新型绿色环保建材制造、贸易及服务,房地产开发经营、...

   数栈君  发表于2024-12-19 17:21  487  0

深入浅出Flink CEP丨如何通过Flink SQL作业动态更新Flink CEP作业

复杂事件处理(CEP)是一种对事件流进行分析的技术,它能够识别出数据流中的事件序列是否符合特定的模式,并允许用户对这些模式进行处理。Flink CEP 是 CEP 在 Apache Flink 中的具体实现,是 Apache Flink 的一个库,使用户可以在...

   数栈君  发表于2024-12-18 14:05  949  0

Hadoop搭建集群(下)

三、Hadoop集群部署1.准备三台服务器主机名IP地址节点类型hadoop101192.168.10.101masterhadoop102192.168.10.102masterhadoop103192.168.10.103master2.节点规划hadoo...

   数栈君  发表于2024-12-18 10:58  355  0

Hadoop搭建集群(上)

前言Hadoop集群部署是为了实现分布式存储和计算,提高大数据处理的效率和性能。1.确定集群规模和硬件资源,选择合适的操作系统和Hadoop版本,进行网络配置,确保集群内各节点之间可以互相通信。2.设置各节点的环境变量,安装和配置Java环境以及其他必要的软件...

   数栈君  发表于2024-12-18 10:47  252  0

【实战讲解】数据血缘落地实施

在复杂的社会分工协作体系中,我们需要明确个人定位,才能更好的发挥价值,数据也是一样,于是,数据血缘应运而生。今天这篇文章会全方位的讲解数据血缘,并且给出具体的落地实施方案。一、数据血缘是什么数据血缘是在数据的加工、流转过程产生的数据与数据之间的关系。提供一种探...

   数栈君  发表于2024-12-17 15:31  347  0

从混乱到清晰:内容分类和信息架构最佳实践

定义Taxonomy 分类法是一种用于组织和分类内容的方法论。它通过建立一组术语列表(词典),帮助你在内容库中管理所有在线数字内容。通过将内容分成类别、标签和元数据,分类法可以让你更轻松地找到和使用数字内容,提升用户体验和内容的可发现性。information...

   数栈君  发表于2024-12-17 15:29  1498  0

【实战讲解】数据血缘落地实施

‍在复杂的社会分工协作体系中,我们需要明确个人定位,才能更好的发挥价值,数据也是一样,于是,数据血缘应运而生。今天这篇文章会全方位的讲解数据血缘,并且给出具体的落地实施方案。一、数据血缘是什么数据血缘是在数据的加工、流转过程产生的数据与数据之间的关系。提供一种...

   数栈君  发表于2024-12-17 15:22  785  0
2259条数据,每页显示10条
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群