当前位置：首页 > web >正文

hadoop的运行模式

web 2025/7/1 23:40:49

（一）Hadoop的运行模式

hadoop一共有如下三种运行方式：

1. 本地运行。数据存储在linux本地，测试偶尔用一下。我们上一节课使用的就是本地运行模式hadoop100。

2. 伪分布式。在一台机器上模拟出 Hadoop 分布式系统的各个组件，各个组件在逻辑上是分离的，但是都运行在同一台物理机器上，以此来模拟分布式环境。

3. 完全分布式。数据存储在HDFS，多台服务器工作，企业中大量使用。

要在本地去模拟这个真实的场景功能，我们需要做好如下的准备：

1）准备3台客户机（关闭防火墙、静态IP、主机名称）

2）安装javaJDK，安装Hadoop，并配置环境变量

3）配置集群

4）单点启动

5）配置ssh

6）群起并测试集群

其中，第1项我们在之前克隆虚拟机的环节中已经完成了。现在我们来看看按照JDK和Hadoop并配置环境变量的工作。有两种思路：

1. 每台机器都去手动安装一次（上传jar包再去解压）。

2. 把一台机器装好，把module 拷贝到其他的机器。这样就不需要省略了上传和解压的工作了。

（二）scp命令--基本使用

我们在前面的课中把hadoop100上安装了java，hadoop这个两个软件，那我们要如何才能把对于的文件拷贝到hadoop101上去？

现在要学一个新的命令： scp。它可以实现服务器与服务器之间的数据拷贝。

1.基本语法

scp -r $pdir/$fname $user@$host:$pdir/$fname

说明：

（1）-r: 表示递归拷贝。如果要拷贝的是文件夹，就把文件夹下的内容都拷贝

（2）$pdir/$fname: 要拷贝的文件路径/名称

（3）$user@host:$pdir/$fname: 目的地用户@主机:目的地路径/名称

注意：要输入相应的账号和密码！

查看全文

http://www.xdnf.cn/news/4377.html

Web前端技术栈：从入门到进阶都需要学什么内容

【Prompt工程—文生图】案例大全

c# LINQ-Query01

C 语言编码规范

Ubuntu也开始锈化了？Ubuntu 计划在 25.10 版本开始引入 Rust Coreutils

鸿蒙开发——1.ArkTS声明式开发(UI范式基本语法)

kotlin一个函数返回多个值

线性代数之矩阵运算：驱动深度学习模型进化的数学引擎

数据可视化与数据编辑器：直观呈现数据价值

在 Ubuntu 中配置 Samba 实现「特定用户可写，其他用户只读」的共享目录

SAP如何反查增强点的位置呢？怎么判断这个报错是增强，还是标准信息呢？

Postman最佳平替, API测试工具Bruno实用教程(一)：基础篇

（2025，AR，NAR，GAN，Diffusion，模型对比，数据集，评估指标，性能对比）文本到图像的生成和编辑：综述

2025年渗透测试面试题总结-网络安全、Web安全、渗透测试笔试总结(一)（附回答）（题目+回答）

大模型工具与案例：云服务器部署dify（1）

不同OS版本中的同一yum源yum list差异排查思路

Unity垃圾回收（GC）

项目模拟实现消息队列第二天

Compose Multiplatform iOS 稳定版发布：可用于生产环境，并支持 hotload

C++命名空间、内联与捕获

linux环境安装docker

AI一键替换商品融入场景，5分钟打造专业级商品图

自编码器（Autoencoder）

遥感数据处理、机器学习建模与空间预测的全流程指南——涵盖R语言（随机森林、XGBoost、SVM等）、特征提取、模型优化及生态学案例分析

Ubuntu日志文件清空的三种方式

力扣49. 字母异位词分组(哈希表)

suna界面实现原理分析（三）：Terminal工具调用可视化

强化学习是AI Agent的进化引擎还是技术枷锁呢？

Spring + Shiro 整合的核心要点及详细实现说明

vLLM 推理 Qwen2.5-VL-7B 视频

相关文章：