当前位置: 首页 > news >正文

Spark应用部署模式实例

Local模式

新启动一个终端

SparkSubmit # pyspark命令启动的进程,实际上就是启动了一个Spark应用程序

Spark Standalone模式

讲解:

6321 SecondaryNameNode  

 #hadoop中HDFS第二数据存储节点,负责定期合并 fsimage 和 edits log 文件  

 7475 Jps  

 6132 DataNode  

 #hadoop中HDFS的数据存储节点,负责存储实际的数据块,并响应来自客户端或 NameNode 的读写请求。  

 7332 Worker  

#spark工作节点,负责接收 Master 节点分配的任务并在本地执行这些任务  

5973 NameNode  

 #hadoop中HDFS的名称节点(核心组件),管理文件系统的命名空间,并控制客户端对文件的访问。  

 6456 ResourceManager  

 #hadoop中YARN的资源经理(主控服务),负责集群资源管理和调度应用的任务。  

 7416 HistoryServer  

 #历史服务进程  

 6761 NodeManager  

 #hadoop中YARN的工作节点上的代理,负责容器生命周期管理,并监控资源使用情况(如CPU、内存、磁盘、网络等)。  

7180 Master  

 #spark主节点,负责集群管理和资源分配  

Spark on YARN模式

停止Standalone服务,启动YARN服务:

将Spark安装目录中的jars依赖库文件放到HDFS上

修改spark-env.sh配置文件

以YARN集群模式启动PySparkShell交互式编程环境

示例应用程序pi.py提交到YARN集群中运行

先关闭Local模式

在浏览器输入:http://localhost:8088/ 查看

http://www.xdnf.cn/news/331525.html

相关文章:

  • 个人网站versionI正式上线了!Personal Website for Jing Liu
  • ✍️【TS类型体操进阶】挑战类型极限,成为类型魔法师!♂️✨
  • JAVA八股文
  • CI/CD与DevOps流程流程简述(提供思路)
  • 使用pdm管理python项目时去哪里找nuitka
  • 如何通过复盘提升团队能力?
  • 数组和集合
  • 【C++的类型转换】
  • 【漏洞预警】:致远OA V8.1 SP2 data.htm DOM型XSS漏洞
  • 使用 `detach()` 断开与共享特征层的连接
  • (已完结)完美解决C盘拓展卷是灰色的无法扩容的问题以及如何正确地在WINDOS上从一个盘扩容到C盘
  • Android 如何理解 Java JNI 中的引用与 Java 对象应用的区别
  • java算法的核心思想及考察的解题思路
  • Codeforces Round 1022 (Div. 2)
  • YOLOv1:开创实时目标检测新纪元
  • go.mod没有自动缓存问题
  • vue截图-html2canvas
  • 《硬件视界》专栏介绍(持续更新ing)
  • Qt学习Day2:信号槽
  • 从SQL的执行流程彻底详解预编译是如何解决SQL注入问题
  • Linux57配置MYSQL YUM源
  • 离散化(竞赛)
  • MinIo安装和使用操作说明(windows)
  • C++相关学习过程
  • 《USB技术应用与开发》第七讲:CDC串口设备案例
  • 【AlphaFold2】深入浅出,讲解Evoformer|学习笔记
  • 【汇正自控阀门集团】签约智橙PLM,智橙助泵阀“以国代进”
  • ntdll!CsrServerApiRoutine函数--csrsrv!CsrCallServerFromServer什么时候被调用?
  • 计算机硬件(南桥):主板芯片组FCH和PCH的区别
  • 苍穹外卖(用户下单、订单支付)