当前位置：首页 > news >正文

CentOS7搭建Hadoop集群

news 2025/6/6 10:16:49

CentOS7搭建Hadoop集群

服务器规划
设置服务器主机名（三个节点都配置）
添加IP与主机名的映射（三个节点都配置）
ssh服务配置
配置JDK环境变量
JDK环境验证
配置Hadoop系统环境变量
验证Hadoop环境
修改hadoop-env.sh文件
修改core-site.xml文件
修改hdfs-site.xml文件
修改mapred-site.xml文件
修改yarn-site.xml文件
修改workers文件
将集群主节点的配置文件分发到其他子节点
格式化文件系统
启动hadoop集群
通过UI界面查看hadoop运行状态

在CentOS7中搭建一个具有3个DataNode节点的HDFS集群

服务器规划

主机名	IP地址
hadoop1	192.168.19.142
hadoop2	192.168.19.143
hadoop3	192.168.19.144

设置服务器主机名（三个节点都配置）

需要在三台服务器上设置服务器主机名

hostnamectl set-hostname hadoop1

在这里插入图片描述

hostnamectl set-hostname hadoop2

在这里插入图片描述

hostnamectl set-hostname hadoop3

在这里插入图片描述
设置完成后重启服务器(reboot)

添加IP与主机名的映射（三个节点都配置）

sudo vim /etc/hosts

在这里插入图片描述

ssh服务配置

三台机器生成公钥和私钥

ssh-keygen -t rsa

在这里插入图片描述
拷贝公钥到另外两台机器
在hadoop1，hadoop2和hadoop3上分别执行以下三行

ssh-copy-id hadoop1

ssh-copy-id hadoop2

ssh-copy-id hadoop3

在这里插入图片描述

配置JDK环境变量

vim ~/.bashrc

在这里插入图片描述
修改完成之后记得使用命令source ~/.bashrc，使修改生效

JDK环境验证

在这里插入图片描述

配置Hadoop系统环境变量

vim ~/.bashrc

在这里插入图片描述
修改完成之后记得使用命令source ~/.bashrc，使修改生效

验证Hadoop环境

在这里插入图片描述
同时添加hadoop为root用户，否则启动的HDFS的时候可能会报错

修改hadoop-env.sh文件

vim hadoop-env.sh

找到export JAVA_HOME的位置修改

在这里插入图片描述

修改core-site.xml文件

主要是配置主进程NameNode的运行主机和运行生成数据的临时目录

vim core-site.xml

在这里插入图片描述

修改hdfs-site.xml文件

设置HDFS数据块的副本数量以及second namenode的地址

vim hdfs-site.xml

在这里插入图片描述

修改mapred-site.xml文件

设置MapReduce的运行时框架

vim mapred-site.xml

在这里插入图片描述

修改yarn-site.xml文件

设置yarn集群的管理者

vim yarn-site.xml

在这里插入图片描述

修改workers文件

该文件用来记录从节点的主机名（hadoop 2.x中为slaves文件）
打开该配置文件，先删除里面的内容（默认localhost），然后配置如下内容。

vim workers

在这里插入图片描述

将集群主节点的配置文件分发到其他子节点

scp -r /usr/local/hadoop/hadoop hadoop2:/usr/local/hadoop/Hadoop

scp -r /usr/local/hadoop/hadoop hadoop3:/usr/local/hadoop/hadoop

传完之后要在hadoop2和hadoop3上分别执行 source ~/.bashrc 命令，来刷新配置文件

格式化文件系统

初次启动HDFS集群时，必须对主节点进行格式化处理。在hadoop1上执行格式化文件系统指令如下：

hdfs namenode -format

在这里插入图片描述

启动hadoop集群

脚本一键启动：
hadoop1主节点上执行：

start-dfs.sh

在主节点上执行

start-yarn.sh

在这里插入图片描述

通过UI界面查看hadoop运行状态

访问地址: http://192.168.19.142:9870
在这里插入图片描述
http://192.168.19.142:8088

查看全文

http://www.xdnf.cn/news/863335.html

Oracle OCP与MySQL OCP认证如何选？

零基础玩转Python生物信息学：数据分析与算法实现

Python Flask中启用AWS Secrets Manager+AWS Parameter Store配置中心

Go语言爬虫系列教程4：使用正则表达式解析HTML内容

dvwa9——Weak Session IDs

Redis-旁路缓存策略详解

常见排序算法详解与C语言实现

Python网页数据抓取常用的库及方法介绍

Python非监督学习

如何轻松地将文件从 PC 传输到 iPhone?

吃透 Golang 基础：数据结构之 Struct

涂胶协作机器人解决方案 | Kinova Link 6 Cobot在涂胶工业的方案应用与价值

四、函数调用包含单个参数之Double类型-mmword，movsd，mulsd，addsd指令，总结汇编的数据类型

4.1 HarmonyOS NEXT原生AI能力集成：盘古大模型端侧部署与多模态交互实战

在compose中的Canvas用kotlin显示多数据波形闪烁的问题

李飞飞World Labs开源革命性Web端3D渲染器Forge！3D高斯溅射技术首次实现全平台流畅运行

VR博物馆推动现代数字化科技博物馆

【Linux】进程信号保存信号处理 OS用户态/内核态

bug：undefined is not iterable (cannot read property Symbol(Symbol.iterator))

Flutter面试题

【学习笔记】Circuit Tracing: Revealing Computational Graphs in Language Models

【OSG学习笔记】Day 15: 路径动画与相机漫游

海康网络摄像头实时取帧转Opencv数组格式(h,w,3)，已实现python、C#

[C]C语言日志系统宏技巧解析

让视觉基础模型（VFMs）像大语言模型（LLMs）一样“会思考”

3D视觉重构工业智造：解码迁移科技如何用“硬核之眼“重塑生产节拍

SOLIDWORKS 2025教育版提供了丰富的自学资源

LabVIEW与Modbus/TCP温湿度监控系统

扫地机产品--材质传感器算法开发与虚拟示波器

R语言基础| 下载、安装

CentOS7搭建Hadoop集群

服务器规划

设置服务器主机名（三个节点都配置）

添加IP与主机名的映射（三个节点都配置）

ssh服务配置

配置JDK环境变量

JDK环境验证

配置Hadoop系统环境变量

验证Hadoop环境

修改hadoop-env.sh文件

修改core-site.xml文件

修改hdfs-site.xml文件

修改mapred-site.xml文件

修改yarn-site.xml文件

修改workers文件

将集群主节点的配置文件分发到其他子节点

格式化文件系统

启动hadoop集群

通过UI界面查看hadoop运行状态

相关文章：