当前位置: 首页 > backend >正文

Ansible 配置并行 - 项目管理笔记

Ansible 配置并行 - 项目管理笔记

概述

在 Ansible 项目管理中,合理配置并行执行策略对提升效率和控制风险至关重要。Ansible 提供了多种方式来控制任务的执行方式,包括并发连接数控制、分批滚动执行和异步任务处理。

Playbook 执行顺序机制

基本执行流程

  • Ansible 按照 Playbook 中定义的顺序执行各个 play
  • 每个 play 中,所有主机会分批执行第一个任务,直到所有批次完成该任务
  • 然后所有主机再分批执行下一个任务,依此类推
  • 只有当所有主机完成所有任务后,Ansible 才会释放 shell 控制

潜在问题

  • 当 play 目标主机数量很大时(数百台),控制节点负载会显著增加
  • 所有主机同时执行可能导致服务中断风险(如同时更新所有 Web 服务器)

配置 forks 控制并发连接

基本概念

forks 参数控制 Ansible 同时建立的最大连接数,默认值为 5

# 查看当前 forks 设置
ansible-config dump | grep FORKS# 查看配置文件中的设置(默认为 5)
grep forks /etc/ansible/ansible.cfg

配置建议

  • Linux 受管主机:大多数任务在受管主机上运行,控制节点负载较小,可将 forks 设置为较高值(接近 100)
  • 网络设备:大多数任务在控制节点上运行,负载较大,应保持较低的 forks 值

使用示例

清单内容:

controller[webs]
node1
node3[dbs]
node2
node4

剧本内容:

---
- name: connectionhosts: alltasks:- name: conneciton 1shell: sleep 5  # 模拟耗时任务,执行5秒- name: conneciton 2debug: msg: connection 2  # 快速执行的任务

执行命令:

ansible-playbook playbook.yaml -f 2  # 使用2个并行连接执行

执行结果:

  • 第一个任务:controller 和 node1 同时完成,然后 node3 和 node2 同时完成,最后 node4 完成
  • 第二个任务:由于执行速度快,5台主机几乎同时完成

配置 serial 实现滚动更新

使用场景

当需要对服务进行更新且要求保持服务可用性时,使用 serial 关键字实现分批滚动更新

使用示例

---
- name: Rolling updatehosts: allserial: 2  # 每次更新2台主机,确保服务连续性tasks:- name: latest apache httpd package is installedyum:name: httpdstate: latest  # 安装最新版本的httpdnotify: restart apache  # 触发处理器handlers:- name: restart apacheservice:name: httpdstate: restarted  # 重启apache服务

百分比配置

serial: "30%"  # 按主机总数的百分比设置批次大小,确保至少1台主机

配置 async 实现异步任务

使用场景

适用于执行时间较长的任务(如大文件下载、系统重启等)

参数说明

  • async: 任务执行的最大超时时间(秒)
  • poll: Ansible 检查任务状态的间隔时间(秒),默认 15

使用示例

示例1:任务超时(失败)
---
- name: connectionhosts: node1tasks:- name: conneciton shell: sleep 10  # 任务需要10秒完成async: 5        # 但只等待5秒,任务会超时失败poll: 2         # 每2秒检查一次任务状态
示例2:后台下载(不等待)
---
- name: connectionhosts: node1tasks:- name: downloadget_url: url: http://192.168.48.100/ISOS/openEuler-24.03-LTS-x86_64-dvd.iso  # 大文件下载dest: /home/laomaasync: 100  # 设置100秒超时poll: 0     # 不轮询检查,立即继续后续任务(后台执行)
示例3:同步执行(默认行为)
---
- name: connectionhosts: node1tasks:- name: conneciton shell: sleep 10  # 任务需要10秒完成async: 0        # 设置为0表示使用默认同步行为poll: 2         # 每2秒检查一次任务状态

使用 wait_for 模块监控条件

文件存在检查

---
- name: test wait forhosts: node1tasks:- shell: sleep 10 && touch /tmp/hello  # 后台创建文件async: 20  # 设置20秒超时(大于sleep时间)poll: 0    # 不轮询,立即继续register: out  # 注册任务输出- name: wait for create /tmp/hellowait_for:path: /tmp/hello  # 等待文件创建state: present    # 检查文件存在delay: 5          # 开始检查前的延迟时间(秒)timeout: 30       # 总超时时间sleep: 2          # 检查间隔

端口可用性检查(系统重启场景)

---
- name: test wait_forhosts: node1,node2tasks:- name: reboot node1shell: shutdown -r now "Ansible updates triggered"  # 重启节点async: 1    # 短暂超时poll: 0     # 不等待,立即继续when: inventory_hostname == "node1"  # 只在node1上执行- name: wait for node1 come backwait_for:host: node1    # 等待的主机port: 22       # 检查的端口(SSH)state: started # 等待端口可用delay: 10      # 开始检查前的延迟(给重启留时间)sleep: 2       # 检查间隔timeout: 300   # 总超时时间(5分钟)when: inventory_hostname == "node2"  # 在node2上执行等待

使用 async_status 模块跟踪异步任务

基本用法

---
- name: test async_statushosts: node1tasks:- shell: sleep 10  # 后台任务async: 20       # 设置20秒超时poll: 0         # 不轮询,立即继续register: out    # 注册任务输出- name: wait forasync_status:jid: "{{ out.ansible_job_id }}"  # 通过任务的ansible_job_id属性跟踪register: job_result  # 注册检查结果until: job_result.finished  # 直到任务完成retries: 30    # 最大重试次数delay: 2       # 重试间隔(秒)

参数说明

  • retries: 最大重试次数(默认 3)
  • delay: 重试间隔时间(默认 5 秒)

执行效果如下图:(共尝试六次,前五次失败,第六次成功)

在这里插入图片描述

总结

result.finished # 直到任务完成
retries: 30 # 最大重试次数
delay: 2 # 重试间隔(秒)


### 参数说明- `retries`: 最大重试次数(默认 3)
- `delay`: 重试间隔时间(默认 5 秒)执行效果如下图:(共尝试六次,前五次失败,第六次成功)[外链图片转存中...(img-e1VDi2xZ-1755615838824)]## 总结通过合理配置 forks、serial、async 等参数,结合 wait_for 和 async_status 模块,可以在项目执行效率和服务稳定性之间找到最佳平衡点,实现高效的 Ansible 自动化管理。
http://www.xdnf.cn/news/18199.html

相关文章:

  • Python入门第11课:Python网络请求入门,使用requests库轻松获取网页数据
  • Leetcode 深度优先搜索 (7)
  • Jenkins项目发布基础
  • UE5 使用RVT制作地形材质融合
  • 网络编程day3
  • leetcode2248. 多个数组求交集
  • Android13车机系统自定义系统栏显示策略之状态栏下拉异常
  • java八股文-中间件-参考回答
  • Commons-io
  • 微算法科技(NASDAQ: MLGO)研究利用PBFT中的动态视图变换机制,实现区块链系统高效运转
  • 2025年5月架构设计师综合知识真题回顾,附参考答案、解析及所涉知识点(六)
  • 笔试——Day43
  • HJ4 字符串分隔
  • C++高频知识点(二十七)
  • CentOS安装SNMPWalk
  • 无畏契约手游上线!手机远控模拟器畅玩、抢先注册稀有ID!
  • Linux的基本操作
  • 遥感amp;机器学习入门实战教程 | Sklearn 案例③:PCA + SVM / 随机森林 对比与调参
  • LAMP架构编译安装部署
  • 垂直领域大模型构建:法律行业“类ChatGPT”系统的训练与落地
  • PythonDay31
  • Vue2+Vue3前端开发_Day1
  • Fragment重要知识点总结
  • Incredibuild 新增 Unity 支持:击破构建时间过长的痛点
  • 机器学习(决策树2)
  • MVVM开源项目
  • Netty处理粘包与拆包
  • vue使用vue-cropper实现图片裁剪之单图裁剪
  • 关于mybatis表关联查询和mybatis-Plus单表查询传入时间查询数据(走索引)
  • Linux Namespace 隔离的“暗面”——故障排查、认知误区与演进蓝图