当前位置: 首页 > news >正文

flume整合Kafka和spark-streaming核心编程

flume整合Kafka

需求1:利用flume监控某目录中新生成的文件,将监控到的变更数据发送给kafka,kafka将收到的数据打印到控制台:

1.查看topic

 2.编辑flume-Kafka.conf,并启动flume

 3.启动Kafka消费者

 4.新增测试数据

 5.查看Kafka消费者控制台

 需求2:Kafka生产者生成的数据利用Flume进行采集,将采集到的数据打印到Flume的控制台上。

1编辑kafka-flume.conf,并启动flume

 2.启动Kafka生产者,并在生产者种写入数据

 3.查看flume采集的数据

 DStream转换

DStream 上的操作与 RDD 的类似,分为 Transformations(转换)和 Output Operations(输出)两种,此外转换操作中还有一些比较特殊的原语,如:updateStateByKey()、transform()以及各种 Window 相关的原语。

Transform

Transform 允许 DStream 上执行任意的 RDD-to-RDD 函数。即使这些函数并没有在 DStream的 API 中暴露出来,通过该函数可以方便的扩展 Spark API。该函数每一批次调度一次。其实也就是对 DStream 中的 RDD 应用转换。

代码案例

 

 

 join

两个流之间的 join 需要两个流的批次大小一致,这样才能做到同时触发计算。计算过程就是对当前批次的两个流中各自的 RDD 进行 join,与两个 RDD 的 join 效果相同

代码案例

 

http://www.xdnf.cn/news/137287.html

相关文章:

  • 什么是可重入锁ReentrantLock?
  • 使用el-table表格动态渲染表头数据之后,导致设置fixed的列渲染出现问题
  • 如何在IDEA中高效使用Test注解进行单元测试?
  • Linux 怎么找Java程序的监听的端口
  • 企业级AI开发利器:Spring AI框架深度解析与实战
  • 解释器体系结构风格-笔记
  • Vuex 和 Pinia 的区别
  • 第2讲:R语言中的色彩美学——科研图表配色指南
  • 用C语言实现——一个中缀表达式的计算器。支持用户输入和动画演示过程。
  • C语言指针5
  • Swift中Class和Struct的深度对比分析
  • VS Code搭建C/C++开发环境
  • CAD版本之——DwgVersion 与 AutoCAD 版本的对应关系
  • UOJ 228 基础数据结构练习题 Solution
  • 【Java学习笔记】冒泡排序
  • 【网工第6版】第5章 网络互联⑪
  • Python 3.14:探索新版本的魅力与革新
  • 同样机身尺寸下伺服电机比无刷电机扭矩更大的原因
  • Mybatis-Plus,IDEA2024版本
  • top 命令里面可以看到进程哪些状态?
  • 浏览器常用快捷键
  • MDF标准
  • 高效使用DeepSeek对“情境+ 对象 +问题“型课题进行开题!
  • 关于开源大模型(如 LLaMA、InternLM、Baichuan、DeepSeek、Qwen 等)二次开发或训练经验的关键点和概述
  • Java基础第四章、面向对象
  • 从零开始用Turtle绘制分形树,数学与编程的完美结合!
  • 声音分离人声和配乐base,vocals,drums -从头设计数字生命第6课, demucs——仙盟创梦IDE
  • element-ui tabs 组件源码分享
  • 前端技术Ajax原理
  • 32.768kHz晶振详解:作用、特性及与其他晶振的区别