当前位置: 首页 > news >正文

Spark-Streaming

Spark-Streaming概述

DStream实操

案例一:WordCount案例

需求:使用 netcat 工具向 9999 端口不断的发送数据,通过 SparkStreaming 读取端口数据并统计不同单词出现的次数

实验步骤:

  1. 添加依赖

<dependency>
    <groupId>org.apache.spark</groupId>
    <artifactId>spark-streaming_2.12</artifactId>
    <version>3.0.0</version>
</dependency>

  1. 编写代码

val sparkConf = new SparkConf().setMaster("local[*]").setAppName("streaming")
val ssc = new StreamingContext(sparkConf,Seconds(3))

val lineStreams = ssc.socketTextStream("node01",9999)
val wordStreams = lineStreams.flatMap(_.split(" "))
val wordAndOneStreams = wordStreams.map((_,1))
val wordAndCountStreams = wordAndOneStreams.reduceByKey(_+_)
wordAndCountStreams.print()

ssc.start()
ssc.awaitTermination()

  1. 启动netcat发送数据

nc -lk 9999

结果:

http://www.xdnf.cn/news/76987.html

相关文章:

  • Kafka 消息积压监控和报警配置的详细步骤
  • AbMole推荐:CRM197--增强免疫原性,突破疫苗研发困境
  • 网络安全·第五天·TCP协议安全分析
  • SuperMap GIS基础产品FAQ集锦(20250421)
  • 前台调用接口的方式及速率对比
  • 【Unity笔记】Unity + OpenXR项目无法启动SteamVR的排查与解决全指南
  • 前端之勇闯DOM关
  • 迅为iTOP-RK3576开发板/核心板6TOPS超强算力NPU适用于ARM PC、边缘计算、个人移动互联网设备及其他多媒体产品
  • NineData 与飞书深度集成,企业级数据管理审批流程全面自动化
  • 应用的“体检”与“换装”:精通Spring Boot配置管理与Actuator监控
  • Qt信号槽连接的三种方法对比
  • 通信与推理的协同冲突与架构解耦路径
  • Linux学习笔记2
  • 常见的HTTP请求报错案例
  • 数据结构*链表- LinkedList
  • 用Go语言正则,如何爬取数据
  • 前端如何优雅地对接后端
  • django之数据的翻页和搜索功能
  • yaml里的挪威问题是啥
  • 从零开始搭建Django博客②--Django的服务器内容搭建
  • 分布式之CAP原则:理解分布式系统的核心设计哲学
  • 【前端】【业务逻辑】 数据大屏自适应方案汇总
  • vs2017中,将CMake构建目录设置在项目目录下
  • Pikachu靶场-RCE漏洞
  • 聊一聊接口服务如何防止被恶意请求
  • HarmonyOS:网络HTTP数据请求
  • 轻量级景好鼠标录制器
  • 爆改 toxml 组件 支持数据双向绑定 解决数据刷新问题
  • 百度搜索 API 相比于爬虫的效率提升、价格及如何注册使用
  • 【MCP Node.js SDK 全栈进阶指南】初级篇(5):MCP提示模板开发