当前位置: 首页 > ops >正文

前端异常监控,性能监控,埋点,怎么做的


你想做的是一个 前端监控系统(Frontend Monitoring / RUM, Real User Monitoring),主要包括:

  • 异常监控(JS 报错、资源加载错误、Promise 未捕获异常)

  • 性能监控(白屏时间、首屏时间、页面加载时间、TTFB、FCP、LCP、CLS 等指标)

  • 行为监控(PV/UV、路由变化、用户操作)

  • 上报机制(采集到的数据怎么上报到监控服务)

  • 可视化与报警(监控后台分析、日志存储、异常告警)

下面我给你出一份 详细方案(从埋点到数据上报再到后端处理):


一、整体架构

  1. 前端 SDK(埋点脚本)

    • 集成到业务项目中(JS/TS SDK)。

    • 负责采集:

      • JS 错误(window.onerror, window.addEventListener('error'), unhandledrejection

      • 性能指标(Performance APIPerformanceObserver

      • 用户行为(click, hashchange, popstate 等事件)

    • 负责数据上报(sendBeacon/fetch/img.src)。

  2. 数据上报服务(Node.js/Go/Python)

    • 接收 SDK 上报的日志。

    • 存储到数据库(如 Elasticsearch、ClickHouse、MongoDB)。

    • 提供查询/分析 API。

  3. 可视化与报警

    • Web 管理后台(React/Vue/Antd)展示监控指标。

    • Grafana/ELK/Prometheus 也可以做日志与指标可视化。

    • 结合钉钉/企业微信/Slack 做告警。


二、前端 SDK 设计与实现

1. JS 错误监控

// 监听同步运行时错误
window.onerror = function (msg, url, line, col, error) {report({type: 'js_error',msg,url,line,col,stack: error?.stack});
};// 监听资源加载错误 (img, script, css)
window.addEventListener('error', function (e) {if (e.target && (e.target.src || e.target.href)) {report({type: 'resource_error',tagName: e.target.tagName,src: e.target.src || e.target.href});}
}, true);// 监听 Promise 未捕获异常
// 对 👍,window.addEventListener('unhandledrejection') 就是专门用来捕获 未被捕获的 Promise 异常 的。
// 在 JavaScript 中,如果你写了一个 Promise,但是没有在 链路的最后 .catch() 处理错误,浏览器就会触发一个 unhandledrejection 事件。window.addEventListener('unhandledrejection', function (e) {report({type: 'unhandledrejection',reason: e.reason});
});

2. 性能监控(Performance API)

  • 白屏时间:从 navigationStart首次 DOM 绘制(FP/FCP)

  • 首屏时间:业务可定义,如首屏主要内容渲染完成。可通过 MutationObserver 或在业务点埋点。

  • 页面加载时间loadEventEnd - navigationStart

  • 核心 Web Vitals

    • FCP (First Contentful Paint)

    • LCP (Largest Contentful Paint)

    • FID (First Input Delay)

    • CLS (Cumulative Layout Shift)

示例:

function getPerformance() {const timing = performance.timing;const paint = performance.getEntriesByType('paint');const nav = timing.navigationStart;return {whiteScreen: paint.find(e => e.name === 'first-paint')?.startTime || 0,fcp: paint.find(e => e.name === 'first-contentful-paint')?.startTime || 0,load: timing.loadEventEnd - nav,domReady: timing.domContentLoadedEventEnd - nav,ttfb: timing.responseStart - nav};
}window.addEventListener('load', () => {setTimeout(() => {report({type: 'performance',data: getPerformance()});}, 3000);
});

3. 用户行为监控(可选)

  • 路由变化监控(SPA:监听 popstate, hashchange)。

  • 点击行为监控(采集 click 元素路径,做埋点统计)。

  • 自定义事件埋点(开发者主动上报)。

// 路由变化
window.addEventListener('hashchange', (e) => {report({type: 'route_change',from: e.oldURL,to: e.newURL});
});

4. 数据上报机制

  • 高优先级(报错、关键性能数据)navigator.sendBeacon(页面卸载前保证发送成功)。

  • 低优先级:批量 fetch 上报。

  • 兜底方案new Image().src = 'url?...'。// 兼容性最好,兼容老浏览器 + 页面卸载时也能发请求

function report(data) {const url = 'https://monitor.xxx.com/report';const body = JSON.stringify({...data,userAgent: navigator.userAgent,url: location.href,timestamp: Date.now()});if (navigator.sendBeacon) {navigator.sendBeacon(url, body);} else {fetch(url, { method: 'POST', body, keepalive: true });}
}

三、后端服务(示例)

  • Node.js + Express + MongoDB/Elasticsearch/ClickHouse

  • 接收上报:

app.post('/report', (req, res) => {const data = req.body;// 存储日志db.collection('logs').insertOne(data);res.json({ code: 0 });
});
  • 定时聚合分析(统计错误率、性能指标分布)。


四、可视化与报警

  • 指标面板(可视化框架:ECharts/Grafana):

    • JS 错误率(随时间趋势)

    • 页面加载时间分布

    • 用户地区、设备分布

  • 异常报警

    • 错误率 > 1%

    • 页面白屏时间 > 3s

    • LCP > 4s
      → 触发告警,推送到钉钉/企业微信。


五、优化与扩展

  • 支持 SourceMap 解析,错误堆栈反解到源码位置。

  • 支持 Session 关联(用户 ID、会话 ID)。

  • 支持 前后端链路追踪(结合 Trace ID,关联后端 APM)。

  • 支持 采样率(例如 1% 用户采集,降低服务器压力)。


📌 总结:
实现一个前端监控系统主要分 采集(前端 SDK) → 上报(sendBeacon/fetch) → 存储(DB/ES) → 分析与报警(Dashboard+告警系统) 四个环节。
你可以先做一个 轻量级 SDK + Node 后端 + Grafana 可视化 的 MVP 版本,然后逐步扩展。

http://www.xdnf.cn/news/18899.html

相关文章:

  • Android 开发 - 数据共享(数据共享、内容提供者实现、动态权限申请)
  • 深度学习篇---模型参数保存
  • [肥用云计算] Serverless 多环境配置
  • PCM转音频
  • 面试之HashMap
  • LightRAG
  • 文档格式转换软件 一键Word转PDF
  • PPT处理控件Aspose.Slides教程:在 C# 中将 PPTX 转换为 Markdown
  • 【qml-7】qml与c++交互(自动补全提示)
  • [n8n] 全文检索(FTS)集成 | Mermaid图表生成
  • Android 使用MediaMuxer+MediaCodec编码MP4视频
  • 辅助驾驶出海、具身智能落地,稀缺的3D数据从哪里来?
  • 介绍智慧城管十大核心功能之一:风险预警系统
  • 架构评审:构建稳定、高效、可扩展的技术架构(下)
  • Java8-21的核心特性以及用法
  • 揭开.NET Core 中 ToList () 与 ToArray () 的面纱:从原理到抉择
  • ⸢ 贰 ⸥ ⤳ 安全架构:数字银行安全体系规划
  • 上海控安:GB 44495-2024《汽车整车信息安全技术要求》标准解读和测试方案
  • 修改win11任务栏时间字体和小图标颜色
  • vue实现表格轮播
  • 力扣18:四数之和
  • Python 实现冒泡排序:从原理到代码
  • PDFMathTranslate:让科学PDF翻译不再难——技术原理与实践指南
  • 2024中山大学研保研上机真题
  • (附源码)基于Spring Boot公务员考试信息管理系统设计与实现
  • 2025年渗透测试面试题总结-36(题目+回答)
  • 数据结构Java--8
  • Linux基础优化(Ubuntu、Kylin)
  • vue2实现背景颜色渐变
  • Java基础 8.27