当前位置: 首页 > ai >正文

搭建spark yarn模式集群

如何搭建 Spark Yarn 模式集群

1. 前置条件准备

在开始搭建 Spark YARN 集群之前,需要确保 Hadoop 和 YARN 已经正常部署并运行。可以通过执行 start-dfs.shstart-yarn.sh 来启动 HDFS 和 YARN。

2. 解压 SPARK 安装包

下载适合版本的 Spark 并将其解压至指定目录。例如,在 /opt/modules/ 下完成解压操作:

tar -zxf spark-3.1.2-bin-hadoop3.2.tgz -C /opt/installs/

此步骤完成后,需确认 Spark 文件夹路径已正确设置。

3. 修改 SPARK 环境配置文件

进入 Spark 的配置目录,编辑 spark-env.sh 文件以适配当前环境需求。保存更改后,可通过以下命令使新配置生效:

source spark-env.sh

该步骤对于定义诸如内存分配、日志级别等参数至关重要

4. 分发配置文件到所有节点
为了保持一致性,建议使用自定义脚本(如 xsync.sh)同步配置文件到整个集群中的各个节点。以下是两个重要 XML 文件及其用途说明:

core-site.xml: 设置默认 FS URI。
yarn-site.xml: 控制 ResourceManager 地址及其他高级选项5。
5. 提交第一个 SPARK 应用程序
验证集群状态良好之后,可以尝试提交一个简单的 Spark Pi 示例作业给 YARN 调度器管理。具体命令如下所示:

bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master yarn \
--deploy-mode cluster \
./examples/jars/spark-examples_2.11-2.1.1.jar

注意这里指定了 master 参数为 “yarn”,意味着采用的是 YARN 模式的资源调度;而 deploy-mode 则选择了 cluster 方式,即驱动程序将在远程 ApplicationMaster 中运行3

6. 监控与调试

最后一步是利用 Web UI 接口监控任务进度及排查潜在错误信息。通常情况下,默认端口号分别为:

  • YARN Resource Manager Dashboard: http://<master>:8088/
  • Spark History Server (可选): 如果启用了历史记录服务,则可在浏览器输入地址栏访问它——通常是 port number 18080

http://www.xdnf.cn/news/2735.html

相关文章:

  • 为什么使用ThreadLocal后要调用remove()方法呢?
  • 9.5/Q1,GBD数据库最新高分文章解读
  • 机器学习-08-时序数据分析预测
  • 在移动应用开发中,如何优化JavaScript的性能
  • 【行业特化篇2】金融行业简历特化指南:合规性要求与风险控制能力的艺术化呈现
  • 用Python做有趣的AI项目 6:AI音乐生成器(LSTM Melody Generator)
  • 在 cmd shell 中执行 metasploit vbs payload
  • OpenAvatarChat要解决UnicodeDecodeError
  • 一文掌握Matplotlib绘图
  • PyQt6基础_QThread
  • 亚马逊如何分析竞品
  • 网工笔记-网络层
  • 软件工程(一):黑盒测试与白盒测试
  • 【浙江大学DeepSeek公开课】人类经验与AI算法的镜像之旅
  • 考研系列-计算机组成原理第七章、输入/输出系统
  • 解锁健康密码:养生的多维智慧
  • 【手册】Linux服务器应急排查实战指南
  • 《Learning Langchain》阅读笔记11-RAG(7)索引优化:RAPTOR方法和ColBERT方法
  • C++:BST、AVL、红黑树
  • 惠普P1108打印机信息
  • gre over ipsec (神州数码)
  • 巧记英语四级单词 Unit6-中【晓艳老师版】
  • SpringBoot启动后自动执行方法的各种方式-笔记
  • 【MCP】第三篇:Cline工具链路追踪——解码“协议引擎“的神经传导奥秘
  • Pytest-mark使用详解(跳过、标记、参数 化)
  • 夜莺 v8.0.0-beta.10 部署
  • 新能源汽车声纹监测技术的发展趋势是什么?
  • 机器学习:【抛掷硬币的贝叶斯后验概率】
  • 【MySQL】-- 增删改查操作(1)
  • AI辅助编程-cursor开发煤矿持证上岗管理程序需求与设计篇