当前位置: 首页 > java >正文

Hadoop复习(二)

部署Hadoop

考试不考部署,就复习选择和大题

 

问题 1 单项选择

2 / 2 分

下面哪个是MapReduce的核心配置文件

core-site.xml

hdfs-site.xml

yarn-site.xml

mapred-site.xml

问题 2 单项选择

2 / 2 分

下面哪个是HDFS的核心配置文件

core-site.xml

hdfs-site.xml

yarn-site.xml

mapred-site.xml

问题 3 单项选择

2 / 2 分

下面哪一个不属于Hadoop的部署模式

单机模式

JVM模式

伪分布式模式

完全分布式模式

问题 4 多项选择

2 / 2 分

启动YARN进程后我们可以看到哪些进程?

NameNode

DataNode

SecordaryNameNode

ResourceManager

NodeManager

问题 5 单项选择

2 / 2 分

HDFS URI我们可以从下面哪个配置文件中查看到

core-site.xml

hdfs-site.xml

yarn-site.xml

mapred-site.xml

问题 6 多项选择

2 / 2 分

启动HDFS进程后我们可以看到哪些进程?

NameNode

DataNode

SecondaryNameNode

ResourceManager

NodeManager

问题 7 单项选择

2 / 2 分

启动HDFS进程的命令是哪个?

start-dfs.sh

start-yarn.sh

stop-dfs.sh

stop-yarn.sh

问题 8 单项选择

2 / 2 分

关闭HDFS进程的命令是哪个?

start-dfs.sh

start-yarn.sh

stop-dfs.sh

stop-yarn.sh

问题 9 单项选择

2 / 2 分

关闭YARN进程的命令是哪个?

start-dfs.sh

start-yarn.sh

stop-dfs.sh

stop-yarn.sh

问题 10 单项选择

2 / 2 分

启动YARN进程的命令是哪个?

start-dfs.sh

start-yarn.sh

stop-dfs.sh

stop-yarn.sh

问题 11 单项选择

2 / 2 分

下面哪个是Hadoop的核心配置文件

正确!  

core-site.xml  

hdfs-site.xml 

yarn-site.xml

mapred-site.xml

问题 12 单项选择

2 / 2 分

下面哪个是YARN的核心配置文件

core-site.xml

hdfs-site.xml

yarn-site.xml

mapred-site.xml

简要说明Hadoop的三种模式

独立模式:独立模式是一种在单台计算机的单个JVM进程中模拟Hadoop集群的工作模式,该模式部署的Hadoop集群实际上并不属于分布式文件系统,而是直接读写本地操作系统的文件系统,此模式部署的Hadoop通常用于快速安装并体验Hadoop的功能,并不适用于实际生产环境

伪分布式:伪分布式模式是一种在单台计算机的不同JVM进程中运行Hadoop集群的工作模式,该模式部署的Hadoop集群实际上是一个为分布式系统,因为Hadoop集群的所以守护进程都运行在一台计算机中,并不能体现出分布式的特点,所以伪分布式模式部署的Hadoop通常用于开发环境中进行测试和调试,并不适用于实际生产环境。

完全分布式:完全分布式模式是一种在多台计算机的JVM进程中运行Hadoop集群的工作模式,该模式部署的Hadoop集群属于分布式系统,因为Hadoop集群的每个守护进程都运行在不同的计算机中,所以完全分布式模式部署的Hadoop通常可作为实际生产环境


词频统计


Hadoop格式化
hadoop namenode -format
启动Hadoop
start-all.sh
创建文件word.txt,内容如下:
Hello world
Hello Hadoop
Bye worldBye Hadoop

上传至HDFS的根目录下
hdfs dfs -put word.txt /
统计词频
cd /opt/hadoop/share/hadoop/mapreducehadoop jar hadoop-mapreduce-examples-3.3.5.jar wordcount /word.txt /out
查看结果目录
hdfs dfs -ls /out
这时可看到两个文件,分别是SUCCESS和part-r-00000
统计结果文件即是part-r-00000
查看结果
hdfs dfs -cat /out/part-r-80080

http://www.xdnf.cn/news/9433.html

相关文章:

  • 网络协议入门:TCP/IP五层模型如何实现全球数据传输?
  • C++学习之STL学习:vector类的使用
  • flutter常用动画
  • c++ 调用opencv或pcl流程
  • 【Tomcat】Tomcat端口仅允许本地访问设置方法
  • 接地气的方式认识JVM(一)
  • i2c-tools使用的介绍及示例(i2cdetect,i2cdump, i2cget、i2cset、i2ctransfer)
  • 解决微信小程序中 Flex 布局下 margin-right 不生效的问题
  • 通用大数据可视化展示平台模板 – 免费HTML源码
  • 聊聊JVM怎么调优?(实战总结)
  • 【Doris基础】Apache Doris中FE和BE的职责详解
  • 端午节互动网站
  • 学习threejs,超炫银河黑洞效果模拟
  • 【Halcon】 affine_trans_image 算子详解
  • vue组件和插件的区别
  • Kafka KRaft + SSL + SASL/PLAIN 部署文档
  • 【剑指offer】链表 系列
  • 万字详解RTR RTSP SDP RTCP
  • DeepSeek R1模型已完成小版本试升级
  • Unity屏幕适配——背景适配
  • leetcode 3372. 连接两棵树后最大目标节点数目 I
  • P8-大模型微调
  • Day05
  • Vuer开源程序 是一个轻量级的可视化工具包,用于与动态 3D 和机器人数据进行交互。它支持 VR 和 AR,可以在移动设备上运行。
  • Ethan的日记5/28
  • leetcode0670. 最大交换-medium
  • 让 Deepseek GPS测速
  • 电脑革命家测试版:硬件检测,6MB 轻量无广告 清理垃圾 + 禁用系统更新
  • Oracle Linux 9 安装 EMCC 13.5:避坑细节与实战经验汇总!
  • GO——内存逃逸分析