当前位置：首页 > ai >正文

实训云上搭建分布式Hadoop集群[2025] 实战笔记

ai 2025/9/3 17:34:24

文章目录

一、实战目标
二、集群规划
- 1. 集群拓扑结构
- 2. 角色分配
- 说明：
三、环境准备
- 1. 修改 SSH 端口（安全加固）
- 操作步骤（所有节点执行）：
- 2. FinalShell 连接配置
- 3. 防火墙配置
- 启动并配置 firewalld：
- 关闭并禁用防火墙（生产环境建议精细配置，测试环境可关闭）：
四、系统基础配置（所有节点）
- 1. 设置主机名
- 2. 配置 hosts 映射
- 3. 关闭防火墙（再次确认）
- 4. 关闭 SELinux
五、配置免密登录（关键步骤）
- 1. 生成密钥对（在 master 节点执行）
- 2. 分发公钥到所有节点
- 3. 验证免密登录
- 4. 查看密钥文件（可选）
六、安装与配置 JDK
- 1. 上传并解压 JDK
- 2. 配置环境变量
- 3. 验证安装
七、安装与配置 Hadoop
- 1. 上传并解压 Hadoop
- 2. 配置环境变量
- 3. 配置 Hadoop 环境文件
- 4. 配置 core-site.xml
- 5. 配置 hdfs-site.xml
- 6. 配置 mapred-site.xml
- 7. 配置 yarn-site.xml
- 8. 配置 workers 文件（原 slaves）
八、分发配置到从节点
- 1. 分发 JDK
- 2. 分发 Hadoop
- 3. 分发系统配置文件
- 4. 从节点刷新配置
九、格式化 NameNode
十、启动 Hadoop 集群
- 1. 启动所有服务
- 2. 查看进程
十一、访问 Web UI 验证集群状态
- 1. HDFS Web UI（9870端口）
- 2. YARN Web UI（8088端口）
十二、关闭 Hadoop 集群
十三、常见问题与解决方案
十四、总结

在这里插入图片描述

一、实战目标

搭建一个高可用的完全分布式 Hadoop 集群，基于 Hadoop 3.3.4 版本，包含 1 个主节点（master）和 2 个从节点（slave1、slave2），实现 HDFS 分布式存储与 YARN 分布式资源调度，支持后续大数据应用开发与部署。

二、集群规划

1. 集群拓扑结构

节点类型	主机名	IP 地址
主节点（Master）	`master`	192.168.1.101
从节点（Slave）	`slave1`	192.168.1.102
从节点（Slave）	`slave2`	192.168.1.103

http://www.xdnf.cn/news/19680.html

相关文章：

【llama.cpp】qwen2_vl_surgery.py详解

C++中的“平凡”之美：std::unique_ptr源码探秘

【SpringBootWeb开发】《一篇带你入门Web后端开发》

【数学建模学习笔记】样本均衡

（一）基础复习（委托）

Python-Flask企业网页平台深度Q网络DQN强化学习推荐系统设计与实现：结合用户行为动态优化推荐策略

@Value注解底层原理（二）

Redis 的整数集合：像分类收纳盒一样的整数专属存储

Obsidian本地笔记工具：构建知识网络关联笔记，支持Markdown与插件生态及知识图谱生成

LoRA至今历程回顾（74）

《水浒智慧》第二部 “英雄是怎么炼成的” （上篇）读书笔记

Linux文本处理工具

机器算法(五）模型选择与调优

基于SpringBoot的广科大在线图书管理系统设计与实现（代码+数据库+LW）

探索JavaScript机器学习：几款流行的库推荐

Leetcode 3670. Maximum Product of Two Integers With No Common Bits

HTML第四课：个人简介页面开发

下载速度爆表，全平台通用，免费拿走！

DaemonSet Job CronJob 概念理解

XML在线格式化 - 加菲工具

Leetcode二分查找（3）

移动硬盘删除东西后，没有释放空间

【机器学习入门】5.2 回归的起源——从身高遗传到线性模型的百年演变

狄利克雷分布作用

CentOS 创建站点

二进制流进行预览pdf、excel、docx

Cisco FMC利用sftp Server拷贝文件方法

0902 C++类的匿名对象