当前位置: 首页 > java >正文

一种Spark程序运行指标的采集与任务诊断实现方式

一种Spark程序运行指标的采集与任务诊断实现方式

编写时间:2023年8月2日

第一次校准时间:2023年8月2日

文章目录

  • 一种Spark程序运行指标的采集与任务诊断实现方式
    • 数据链路
    • 采集器的类图
    • CustomSparkListener采集的指标
      • task相关
      • stage相关
      • Job相关
      • Executors相关
    • 诊断
      • 诊断分类
        • 调度阶段诊断
        • 周期性诊断
        • 应用结束诊断
      • 诊断报告
    • 附录 Spark程序的运行监听器
        • **SparkListener**
        • **StreamingListener**接口

数据链路

  1. spark-metrics-collector.jar 作为Spark运行扩展包部署在Spark上,在Spark程序运行时,在SparkContext中将CustomSparkListener监听器注册到listenerBus中。进行任务的跟踪、指标采集与诊断。同理在StreamingContext中将CustomStreamingListener监听器注册到StreamingListenerBus中,对流式任务的跟踪、指标采集与诊断。
  2. 通过监听器将程序运行是的相关指标进行采集、诊断后发送到指标的统一接收端(DMA),做数据删选后,写入对应的Kafka的Topic中。
  3. 通过消费对应的Topic,将相关数据存入分析系统中。

采集器的类图

离线任务采集

http://www.xdnf.cn/news/1699.html

相关文章:

  • CE第二次作业
  • NODE_OPTIONS=--openssl-legacy-provider vue-cli-service serve
  • Git 的基本概念和使用方式
  • C++跨平台开发要点
  • Spring AI 核心概念
  • 【Linux】网络基础和socket
  • HGDB安全版单机修改用户密码
  • spring-ai使用Document存储至milvus的数据结构
  • dockercompose文件仓库
  • [Java]动态代理
  • CSS基础
  • Ubuntu系统下交叉编译iperf3
  • 项目管理:企业战略落地的引擎与未来竞争力的核心密码
  • 力扣面试150题--基本计算器
  • 如何将极狐GitLab 合并请求导出为 CSV?
  • 基于深度学习和单目测距的前车防撞及车道偏离预警系统
  • 凸优化理论记录
  • 【Rust 精进之路之第24章错误处理·实践】错误处理策略与 `anyhow`:简化应用层错误管理
  • Redis 有序集合 ZSet 深度解析教程
  • Unity3D 基于机器学习的 AI 行为树
  • QtDesigner中Label控件详解
  • uniappx 打包配置32位64位x86安装包
  • 【数据可视化-25】时尚零售销售数据集的机器学习可视化分析
  • 02_java的运行机制以及JDKJREJVM基本介绍
  • 补题【Darkness+Different Billing+Dice Game】
  • C++开发之设计模式
  • 大模型的超参数Top P是什么 ?有什么用?
  • three.js精灵及精灵材质、Shader源码分析
  • ERROR: x264 not found using pkg-config
  • 海思ISP调试记录