当前位置: 首页 > news >正文

如何搭建spark yarn模式集群的集群

以下是搭建 Spark YARN 模式集群的一般步骤:

准备工作

  • 确保集群中各节点已安装并配置好 Java 环境,且版本符合 Spark 要求。
  • 规划好集群中节点的角色,如 Master 节点、Worker 节点等,并确保各节点之间网络畅通,能相互访问。

安装 Hadoop

配置 Spark on YARN

  • 下载适合你系统的 Hadoop 版本,解压到指定目录。
  • 配置 Hadoop 的核心配置文件,如core-site.xmlhdfs-site.xmlmapred-site.xmlyarn-site.xml,设置相关参数,如文件系统路径、资源分配等。
  • 格式化 Hadoop 文件系统(通常在 Master 节点上执行):hdfs namenode -format
  • 启动 Hadoop 集群,包括 NameNode、DataNode、ResourceManager 和 NodeManager 等服务。
  • 安装 Spark

  • 下载 Spark 安装包,解压到集群各节点的指定目录。
  • 进入 Spark 的配置目录,复制spark-env.sh.templatespark-env.sh,并进行编辑,设置以下环境变量:
    • export JAVA_HOME=/path/to/java(替换为实际的 Java 安装路径)
    • export HADOOP_CONF_DIR=/path/to/hadoop/conf(Hadoop 配置文件目录)
    • 可以根据需要设置其他参数,如SPARK_MEM等。
  • 同样在配置目录下,复制slaves.templateslaves,在slaves文件中列出所有 Worker 节点的主机名或 IP 地址,每行一个。
  • 编辑spark-defaults.conf文件,添加或修改以下配置:
    • spark.master yarn:指定 Spark 运行在 YARN 模式下。
    • spark.submit.deployMode cluster:设置提交模式为集群模式。
    • 还可以配置其他参数,如spark.executor.memoryspark.executor.cores等,以调整资源分配。

启动 Spark 集群

  • 在 Master 节点上,使用以下命令提交一个 Spark 示例应用程序来测试集群是否正常运行:
  • spark-submit \
    --class org.apache.spark.examples.SparkPi \
    --master yarn \
    --deploy-mode cluster \
    /path/to/spark-examples.jar \
    [parameters]

  • 其中,/path/to/spark-examples.jar是 Spark 示例应用程序的路径,[parameters]是应用程序所需的参数。

验证集群

  • 可以通过 Hadoop 的 YARN Web 界面(通常在http://resourcemanager-host:8088)查看应用程序的运行状态和资源使用情况。
  • 也可以通过 Spark 的 Web 界面(通常在http://master-host:4040,如果是集群模式,可能在 YARN 的应用程序页面中找到 Spark 的 Web UI 链接)查看 Spark 应用程序的详细信息,如执行计划、任务进度等。
http://www.xdnf.cn/news/297451.html

相关文章:

  • OpenKylin安装Elastic Search8
  • 多线程“CPU 飙高”问题:如何确保配置的线程数与CPU核数匹配(Java、GoLang、Python )中的最佳实践解决方案
  • 数据分析指标体系
  • 深度剖析:可视化如何重塑驾驶舱信息交互模式
  • [Linux]多线程(一)充分理解线程库
  • 天文探秘学习小结
  • 【Linux系统】探索进程等待与程序替换的奥秘
  • Java引用RabbitMQ快速入门
  • 2025 后端自学UNIAPP【项目实战:旅游项目】1、创建项目框架
  • Linux之基础开发工具二(makefile,git,gdb)
  • react naive 网络框架源码解析
  • React Hooks 深入浅出
  • EasyRTC嵌入式音视频通信SDK技术,助力工业制造多场景实时监控与音视频通信
  • Apache Velocity代码生成简要介绍
  • css3伸缩盒模型第二章(侧轴相关)
  • 薪技术|0到1学会性能测试第45课-apache调优技术
  • 2025年03月电子学会青少年软件编程 图形化二级考级真题——风车
  • 智能修复大模型生成的 JSON 字符串:Python 实现与优化
  • VMware搭建ubuntu保姆级教程
  • 智能推理DeepSeek-R1+Word深度整合业级智能办公构建
  • 手机携号转网查询,一键查看号码是否可转网!
  • (undone) xv6-labs-2020 补充 LAB lazy page allocation (Day11 xv6-2020 LAB5 懒分配)
  • 双ISP(双互联网服务提供商)
  • eNSP中路由器OSPF协议配置完整实验和命令解释
  • 在Unity AR应用中实现摄像头切换功能
  • STL?string!!!
  • 【Azure Redis】Redis导入备份文件(RDB)失败的原因
  • P56-P60 统一委托,关联游戏UI,UI动画,延迟血条
  • 【Qt4】Qt4中实现PDF预览
  • 香港云服务器在跨境电商的应用