当前位置：首页 > news >正文

Spark应用部署模式实例

news 2025/7/4 16:03:23

Local模式

新启动一个终端

SparkSubmit # pyspark命令启动的进程，实际上就是启动了一个Spark应用程序

Spark Standalone模式

讲解：

6321 SecondaryNameNode

#hadoop中HDFS第二数据存储节点，负责定期合并 fsimage 和 edits log 文件

7475 Jps

6132 DataNode

#hadoop中HDFS的数据存储节点，负责存储实际的数据块，并响应来自客户端或 NameNode 的读写请求。

7332 Worker

#spark工作节点，负责接收 Master 节点分配的任务并在本地执行这些任务

5973 NameNode

#hadoop中HDFS的名称节点（核心组件），管理文件系统的命名空间，并控制客户端对文件的访问。

6456 ResourceManager

#hadoop中YARN的资源经理（主控服务），负责集群资源管理和调度应用的任务。

7416 HistoryServer

#历史服务进程

6761 NodeManager

#hadoop中YARN的工作节点上的代理，负责容器生命周期管理，并监控资源使用情况（如CPU、内存、磁盘、网络等）。

7180 Master

#spark主节点，负责集群管理和资源分配

Spark on YARN模式

停止Standalone服务，启动YARN服务：

将Spark安装目录中的jars依赖库文件放到HDFS上

修改spark-env.sh配置文件

以YARN集群模式启动PySparkShell交互式编程环境

示例应用程序pi.py提交到YARN集群中运行

先关闭Local模式

在浏览器输入：http://localhost:8088/ 查看

查看全文

http://www.xdnf.cn/news/331525.html

个人网站versionI正式上线了！Personal Website for Jing Liu

✍️【TS类型体操进阶】挑战类型极限，成为类型魔法师！♂️✨

JAVA八股文

CI/CD与DevOps流程流程简述（提供思路）

使用pdm管理python项目时去哪里找nuitka

如何通过复盘提升团队能力？

数组和集合

【C++的类型转换】

【漏洞预警】：致远OA V8.1 SP2 data.htm DOM型XSS漏洞

使用 `detach()` 断开与共享特征层的连接

（已完结）完美解决C盘拓展卷是灰色的无法扩容的问题以及如何正确地在WINDOS上从一个盘扩容到C盘

Android 如何理解 Java JNI 中的引用与 Java 对象应用的区别

java算法的核心思想及考察的解题思路

Codeforces Round 1022 (Div. 2)

从SQL的执行流程彻底详解预编译是如何解决SQL注入问题

Linux57配置MYSQL YUM源

离散化（竞赛）

MinIo安装和使用操作说明（windows）

C++相关学习过程

《USB技术应用与开发》第七讲：CDC串口设备案例

【AlphaFold2】深入浅出，讲解Evoformer|学习笔记

【汇正自控阀门集团】签约智橙PLM，智橙助泵阀“以国代进”

ntdll!CsrServerApiRoutine函数--csrsrv!CsrCallServerFromServer什么时候被调用？

计算机硬件（南桥）：主板芯片组FCH和PCH的区别

苍穹外卖（用户下单、订单支付）

Local模式

Spark Standalone模式

Spark on YARN模式

相关文章：