当前位置：首页 > news >正文

【Flink】并行度的设置

news 2025/9/1 6:08:10

并行度的设置

在Flink中，可以用不同的方法来设置并行度，它们的有效范围和优先级别也是不同的

（1）代码中设置
我们在代码中，可以很简单地在算子后跟着调用setParallelism()方法，来设置当前算子的并行度：

stream.map(word -> Tuple2.of(word, 1L)).setParallelism(2);

这种方式设置的并行度，只针对当前算子有效。

另外，我们也可以直接调用执行环境的setParallelism()方法，全局设定并行度：

env.setParallelism(2);

这样代码中所有算子，默认的并行度就都为2了。我们一般不会在程序中设置全局并行度，因为如果在程序中对全局并行度进行硬编码，会导致无法动态扩容。

这里要注意的是，由于keyBy不是算子，所以无法对keyBy设置并行度。

（2）提交应用时设置

在使用 flink run 命令提交应用时，可以增加 -p 参数来指定当前应用程序执行的并行度，它的作用类似于执行环境的全局设置：

bin/flink run –p 2 –c com.atguigu.wc.SocketStreamWordCount 
./FlinkTutorial-1.0-SNAPSHOT.jar

如果我们直接在Web UI上提交作业，也可以在对应输入框中直接添加并行度。

在这里插入图片描述

将代码打包，上传运行

在这里插入图片描述

bin/flink run -m master:8081 -p 2 -c SocketStreamWordCount /root/FlinkTutorial-1.17-1.0-SNAPSHOT.jar

在这里插入图片描述

可以看到代码优先级要大于提交时候指定的参数

（3）配置文件中设置

我们还可以直接在集群的配置文件flink-conf.yaml中直接更改默认并行度：

parallelism.default: 2

这个设置对于整个集群上提交的所有作业有效，初始值为 1 。无论在代码中设置、还是提交时的-p参数，都不是必须的；所以在没有指定并行度的时候，就会采用配置文件中的集群默认并行度。在开发环境中，没有配置文件，默认并行度就是当前机器的线程数。

优先级：

算子 > env > 提交时指定 > 配置文件

查看全文

http://www.xdnf.cn/news/1408087.html

从 JDK 8 到 JDK 17

dify docker知识库topk最大值参数配置

Linux 文件夹权限也会导致基本命令权限缺失问题

Langflow 框架中 Prompt 技术底层实现分析

第2.4节：大模型之LLaMA系列（Meta）

项目跑起来之前的那些事

shell的原理和Linux的指令效果演示

Rust 登堂之枚举和整数（八）

K8s学习笔记（一）——

试试 Xget 加速 GitHub 克隆仓库

React前端开发_Day12_极客园移动端项目

Windows中如何将Docker安装在E盘并将Docker的镜像和容器存储在E盘的安装目录下

IDM（Internet Download Managerv 6.38）破除解版下载！IDM 下载器永久免费版！提升下载速度达5倍！安装及使用

Google 的 Agent2Agent 协议（A2A）：带示例的指南

Java试题-选择题（26）

Swin Transformer基本原理与传统Transformer对比图解

Lua基础知识精炼

vim-plugin AI插件

运筹说第141期 | 启发式算法：用简单规则、破解复杂问题

网络端口与服务对应表 - 白帽子安全参考指南

C#基础（③CMD进程）

LLM记账智能体-MCP服务-实现步骤与效果展示

AI辅助编程日记和chat历史开源Series 1：VSCode + GitHub Copilot 自动下载及安装软件

《打破 “慢“ 的黑箱：前端请求全链路耗时统计方案》

Vue3 响应式基础

前端学习——JavaScript基础

并行度的设置

相关文章：