Hadoop集群

Hadoop集群

Hadoop伪分布式配置教程-1

网友分享数栈君 发表了文章 • 0 个评论 • 67 次浏览 • 2023-10-11 15:38 • 来自相关话题

一、创建Hadoop用户1.创建Hadoop用户输入如下命令创建新用户 :sudo useradd -m hadoop -s /bin/bash这条命令创建了可以登陆的 hadoop 用户,并使用 /bin/bash 作为 shell。接着使用如下命令设置密码... ...查看全部

Mysql常见的集群方案

知识百科数栈君 发表了文章 • 0 个评论 • 82 次浏览 • 2023-09-26 10:10 • 来自相关话题

随着互联网的高速发展,大量的数据被产生、存储和处理。为了满足大数据处理的需求,数据库技术也在不断地发展和完善。Mysql作为一种关系型数据库管理系统,已经被广泛应用于各种场景。然而,单机版的Mysql在面对大规模数据时,会出现性能瓶颈,这时候就需要通过集群来解... ...查看全部

Elasticsearch中使用IK分词配置

知识百科数栈君 发表了文章 • 0 个评论 • 43 次浏览 • 2023-09-25 10:54 • 来自相关话题

在Elasticsearch中,IK分词是一种基于ik_max_word(最大分词长度)和ik_smart(智能分词模式)的分词插件。它可以对中文文本进行分词,支持三种分词模式:精确模式、全模式和搜索引擎模式。本文将介绍如何在Elasticsearch中配置I... ...查看全部

数据标签体系架构设计

知识百科沸羊羊 发表了文章 • 0 个评论 • 50 次浏览 • 2023-09-21 11:28 • 来自相关话题

随着大数据时代的到来,数据量呈现爆炸式增长,如何从海量数据中提取有价值的信息成为了一个重要的课题。数据标签是数据挖掘和机器学习的基础,通过对数据进行标注,可以使得机器能够更好地理解和处理数据。本文将介绍一种数据标签体系架构的设计方法,以帮助读者更好地理解如何构... ...查看全部

Hadoop HA集群两个NameNode都是standby或者主NameNode是standby,从NameNode是active的情况集锦

知识百科数栈君 发表了文章 • 0 个评论 • 69 次浏览 • 2023-08-28 10:24 • 来自相关话题

【Hadoop】关于Hadoop集群HDFS启动问题:DataNode启动报错ERROR: Cannot set priority of namenode process

知识百科数栈君 发表了文章 • 0 个评论 • 346 次浏览 • 2023-08-02 10:46 • 来自相关话题

【Hadoop】高可用集群搭建

网友分享数栈君 发表了文章 • 0 个评论 • 120 次浏览 • 2023-08-01 10:46 • 来自相关话题

一、Zookeeper安装✨    1.将Zookeeper压缩包上传到 Hadoop102的/opt/software 目录下这里我们还是使用Xshell+Xftp进行文件上传,将Zookeeper上传。      2.解压到 /opt/module/HA ... ...查看全部

Hadoop生态之Mapreduce

网友分享数栈君 发表了文章 • 0 个评论 • 94 次浏览 • 2023-07-31 11:34 • 来自相关话题

1.MapReduce概述1.1 MapReduce定义MapReduce是一个分布式运算程序的编程框架,是用户开发“基于Hadoop的数据分析应用”的核心框架。MapReduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,... ...查看全部

Hive:基于Hadoop的数据仓库

网友分享数栈君 发表了文章 • 0 个评论 • 166 次浏览 • 2023-07-25 16:30 • 来自相关话题

Hive 具有 SQL 数据库的外表,但应用场景完全不同, Hive 只适合用来做批量海量数据统计分析,也就是数据仓库。Hive 是基于 Hadoop 的一个数据仓库工具,实质就是一款基于 HDFS 的 MapReduce 计算框架,因为Hive 依赖于 HD... ...查看全部

Hadoop:第一代分布式存储计算框架

网友分享数栈君 发表了文章 • 0 个评论 • 202 次浏览 • 2023-07-25 16:28 • 来自相关话题

1Hadoop 第一代分布式存储计算框架Hadoop是一个分布式系统基础架构,由Apache基金会开发,它允许用户在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力高速运算和存储。Hadoop包含丰富的生态组件,有我们耳熟能详的分布式文件系统H... ...查看全部

数据安全新战场,大数据基础平台EasyMR为企业筑起“安全防线”

产品交流数栈君 发表了文章 • 0 个评论 • 274 次浏览 • 2022-12-09 10:41 • 来自相关话题

“ 2020年1月,时间跨度长达14年的,微软2.5亿条客户服务和支持记录在网上泄露;同年4月,微盟发生史上最贵“删库跑路”事件,造成微盟市值一夜之间缩水约24亿港币;今年7月,网信办依据《数据安全法》等法律法规,对滴滴公司开出人民币80.26亿元的巨额罚款,... ...查看全部

国产自研、安全、高可用——袋鼠云大数据基础平台EasyMR筑基企业数字化转型

产品交流数栈君 发表了文章 • 0 个评论 • 418 次浏览 • 2022-12-02 10:46 • 来自相关话题

近年来,国际形势的风云变幻,中美双边关系的恶化,自2013年“棱镜门”事件之后,又一次警示国人,对于科技领域,只有自己掌握核心关键技术,实现自主可控,才能摆脱越来越频繁的“卡脖子事件”,保证企业和国家信息安全。俗话说“基础不牢,地动山摇“。大数据基础平台什么?... ...查看全部

Hadoop伪分布式配置教程-1

网友分享数栈君 发表了文章 • 0 个评论 • 67 次浏览 • 2023-10-11 15:38 • 来自相关话题

一、创建Hadoop用户1.创建Hadoop用户输入如下命令创建新用户 :sudo useradd -m hadoop -s /bin/bash这条命令创建了可以登陆的 hadoop 用户,并使用 /bin/bash 作为 shell。接着使用如下命令设置密码... ...查看全部

Mysql常见的集群方案

知识百科数栈君 发表了文章 • 0 个评论 • 82 次浏览 • 2023-09-26 10:10 • 来自相关话题

随着互联网的高速发展,大量的数据被产生、存储和处理。为了满足大数据处理的需求,数据库技术也在不断地发展和完善。Mysql作为一种关系型数据库管理系统,已经被广泛应用于各种场景。然而,单机版的Mysql在面对大规模数据时,会出现性能瓶颈,这时候就需要通过集群来解... ...查看全部

Elasticsearch中使用IK分词配置

知识百科数栈君 发表了文章 • 0 个评论 • 43 次浏览 • 2023-09-25 10:54 • 来自相关话题

在Elasticsearch中,IK分词是一种基于ik_max_word(最大分词长度)和ik_smart(智能分词模式)的分词插件。它可以对中文文本进行分词,支持三种分词模式:精确模式、全模式和搜索引擎模式。本文将介绍如何在Elasticsearch中配置I... ...查看全部

数据标签体系架构设计

知识百科沸羊羊 发表了文章 • 0 个评论 • 50 次浏览 • 2023-09-21 11:28 • 来自相关话题

随着大数据时代的到来,数据量呈现爆炸式增长,如何从海量数据中提取有价值的信息成为了一个重要的课题。数据标签是数据挖掘和机器学习的基础,通过对数据进行标注,可以使得机器能够更好地理解和处理数据。本文将介绍一种数据标签体系架构的设计方法,以帮助读者更好地理解如何构... ...查看全部

Hadoop HA集群两个NameNode都是standby或者主NameNode是standby,从NameNode是active的情况集锦

知识百科数栈君 发表了文章 • 0 个评论 • 69 次浏览 • 2023-08-28 10:24 • 来自相关话题

【Hadoop】关于Hadoop集群HDFS启动问题:DataNode启动报错ERROR: Cannot set priority of namenode process

知识百科数栈君 发表了文章 • 0 个评论 • 346 次浏览 • 2023-08-02 10:46 • 来自相关话题

【Hadoop】高可用集群搭建

网友分享数栈君 发表了文章 • 0 个评论 • 120 次浏览 • 2023-08-01 10:46 • 来自相关话题

一、Zookeeper安装✨    1.将Zookeeper压缩包上传到 Hadoop102的/opt/software 目录下这里我们还是使用Xshell+Xftp进行文件上传,将Zookeeper上传。      2.解压到 /opt/module/HA ... ...查看全部

Hadoop生态之Mapreduce

网友分享数栈君 发表了文章 • 0 个评论 • 94 次浏览 • 2023-07-31 11:34 • 来自相关话题

1.MapReduce概述1.1 MapReduce定义MapReduce是一个分布式运算程序的编程框架,是用户开发“基于Hadoop的数据分析应用”的核心框架。MapReduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,... ...查看全部

Hive:基于Hadoop的数据仓库

网友分享数栈君 发表了文章 • 0 个评论 • 166 次浏览 • 2023-07-25 16:30 • 来自相关话题

Hive 具有 SQL 数据库的外表,但应用场景完全不同, Hive 只适合用来做批量海量数据统计分析,也就是数据仓库。Hive 是基于 Hadoop 的一个数据仓库工具,实质就是一款基于 HDFS 的 MapReduce 计算框架,因为Hive 依赖于 HD... ...查看全部

Hadoop:第一代分布式存储计算框架

网友分享数栈君 发表了文章 • 0 个评论 • 202 次浏览 • 2023-07-25 16:28 • 来自相关话题

1Hadoop 第一代分布式存储计算框架Hadoop是一个分布式系统基础架构,由Apache基金会开发,它允许用户在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力高速运算和存储。Hadoop包含丰富的生态组件,有我们耳熟能详的分布式文件系统H... ...查看全部