当前位置: 首页 > backend >正文

Spark集群搭建-Standalone

以下是Spark Standalone集群搭建的关键步骤(基于Linux系统):
 
一、环境准备
 
1. 安装Java
 
- 确保所有节点安装JDK 8+,配置 JAVA_HOME 环境变量。
 
2. 关闭防火墙
bash
systemctl stop firewalld && systemctl disable firewalld
 
 
3. 配置SSH免密登录
 
- 主节点生成密钥并分发到所有从节点:
bash
ssh-keygen -t rsa # 按提示完成,不设密码  
ssh-copy-id slave1 # 替换为从节点主机名/IP  
 
 
二、下载与解压Spark
 
1. 下载Spark包
 
- 官网下载对应版本(如 spark-3.5.0-bin-hadoop3 ),上传至主节点。
 
2. 解压并配置
bash
tar -zxvf spark-3.5.0-bin-hadoop3.tgz -C /opt  
cd /opt/spark-3.5.0-bin-hadoop3/conf  
cp spark-env.sh.template spark-env.sh  
 
 
 
- 编辑 spark-env.sh ,添加:
bash
export JAVA_HOME=/usr/lib/jvm/java-11-openjdk # 替换为实际路径  
export SPARK_MASTER_IP=master_hostname # 主节点主机名/IP  
export SPARK_WORKER_MEMORY=2g # 从节点内存(按需调整)  
 
 
三、配置集群节点
 
1. 修改 slaves 文件
bash
cp slaves.template slaves  
echo "slave1" >> slaves # 添加从节点主机名/IP,每行一个  
echo "slave2" >> slaves  
 
 
2. 分发Spark到从节点
bash
scp -r /opt/spark-3.5.0-bin-hadoop3 slave1:/opt  
scp -r /opt/spark-3.5.0-bin-hadoop3 slave2:/opt  
 
 
四、启动集群
 
1. 启动主节点
bash
cd /opt/spark-3.5.0-bin-hadoop3  
sbin/start-master.sh  
 
 
2. 启动从节点
bash
sbin/start-slaves.sh  
 
 
3. 验证状态
 
- 主节点Web界面: http://master_ip:8080 ,查看从节点是否在线。
 
五、常用操作
 
- 停止集群:
bash
sbin/stop-slaves.sh && sbin/stop-master.sh  
 
 
- 提交任务:
bash
bin/spark-submit \  
  --class org.apache.spark.examples.SparkPi \  
  --master spark://master_ip:7077 \  
  ./examples/jars/spark-examples_*.jar 10  
 

http://www.xdnf.cn/news/6031.html

相关文章:

  • 芯片:金线的作用
  • 关于 ast: Babel AST 全类型总览
  • 在Java中实现Parcelable接口和Serializable接口有什么区别?
  • trame实现双视图(返场版)
  • MySQL 日期计算方法 date_sub()、date_add()、datediff() 详解-文中有示例帮助理解
  • java基础-泛型
  • tails os系统详解
  • 实物工厂零件画图案例(上)
  • 进程与线程:09 进程同步与信号量
  • Linux的域名解析服务器
  • OAuth安全架构深度剖析:协议机制与攻防实践
  • 【Nacos】env NACOS_AUTH_IDENTITY_KEY must be set.
  • SparkSQL 连接 MySQL 并添加新数据:实战指南
  • uniapp+vue3中自动导入ref等依赖
  • 通义灵码2.5版本全新体验
  • CSP-J普及组第一轮真题单选题专项训练(二)
  • NumPy 2.x 完全指南【九】常量
  • 虹科应用 | 探索PCAN卡与医疗机器人的革命性结合
  • 软件测试(2)软件测试分类及流程
  • 【自学30天掌握AI开发】 - 课程简介
  • Spring事务失效的全面剖析
  • C++:重载>>和<<(输入和输出运算符)
  • [FA1C4] 博客链接
  • OpenTiny icons——超轻量的CSS图标库,引领图标库新风向
  • Weblogic 反序列化远程命令执行漏洞 CVE-2019-2725 详解
  • Eaton XV-102-BE-35TQRC-10是伊顿(Eaton)公司推出的一款高性能触摸屏人机界面(HMI)
  • Python | Dashboard制作
  • 【报错解决】服务器重启后vscode远程连接失败
  • MySQL推荐书单:从入门到精通
  • 3545. 不同字符数量最多为 K 时的最少删除数