当前位置: 首页 > backend >正文

基于Redis实现-UV统计

基于Redis实现-UV统计

本文将使用HyperLogLog来实现UV统计。

首先我们搞懂两个概念:

  • UV:全称Unique Visitor,也叫独立访客量,是指通过互联网访问、浏览这个网页的自然人。1天内同一个用户多次访问该网站,只记录一次。
  • PV:全称Page View,也叫页面访问量或点击量,用户每访问网站的一个页面,记录一次PV,用户多次打开页面,则记录多次PV,往往用来衡量网站的流量。

UV统计在服务端做会比较麻烦,因为要判断该用户是否已经统计过了,需要将统计的用户信息保存,但是如果每个访问的用户都保存到Redis中,数据量会非常恐怖。

1.HyperLogLog(HLL)

HyperLogLog(HLL)是从Loglog算法派生的概率算法用于确定非常大的集合的基数,而不需要存储其所有值。相关算法原理大家可以参考:算法介绍
Redis中的HLL是基于string结构实现的,单个HLL的内存永远小于16kb,内存占用极低!作为代价,其测量结果是概率性的,有小于0.81%的误差。不过对于UV统计来说,这完全可以忽略

#1. PFADD — 添加元素到 HyperLogLog
#作用:向指定的 HLL 中添加一个或多个元素。
#返回值:1:如果至少有一个新元素被添加  0:如果所有元素已经存在(不会重复计数)
# 向 "daily_uv" 添加 3 个用户访问记录
PFADD daily_uv user1 user2 user3
(integer) 1  # 表示有新增数据# 再次添加(user1 已存在,但 user4 是新用户)
PFADD daily_uv user1 user4
(integer) 1  # user4 是新元素,返回 1
--------------------------------------------------------------------------------------------
#2. PFCOUNT — 计算基数(不重复元素数量)
#作用:返回 HLL 中近似的不重复元素数量(允许少量误差)。
#返回值:估算的基数(如 UV 数)。
# 查询 "daily_uv" 的独立访客数
PFCOUNT daily_uv
(integer) 4  # 返回近似值(实际可能是 4 或 3.96≈4)# 计算多个 HLL 的并集(如统计一周的 UV)
PFCOUNT monday_uv tuesday_uv wednesday_uv
(integer) 1250  # 返回 3 天的总 UV(去重后)
--------------------------------------------------------------------------------------------
#3. PFMERGE — 合并多个 HyperLogLog
#作用:将多个 HLL 合并成一个新的 HLL(计算并集)。
#返回值:OK(成功时返回)。
# 合并 "monday_uv" 和 "tuesday_uv" 到 "weekly_uv"
PFMERGE weekly_uv monday_uv tuesday_uv
OK# 查询合并后的 UV
PFCOUNT weekly_uv
(integer) 850  # 返回两天的总 UV(去重后)

在这里插入图片描述

2.使用UV统计

这里先查看此时Redis内存使用情况:

  • used_memory:1485704(字节)
  • used_memory_human:1.42M

在这里插入图片描述

我们向Redis插入100万条数据:

@Resource
private StringRedisTemplate stringRedisTemplate;
@Test
void testHyperLogLog() {// 准备数组,装用户数据String[] users = new String[1000];// 数组角标int index = 0;for (int i = 1; i <= 1000000; i++) {// 赋值users[index++] = "user_" + i;// 每1000条发送一次if (i % 1000 == 0) {index = 0;stringRedisTemplate.opsForHyperLogLog().add("Num", users);}}// 统计数量Long size = stringRedisTemplate.opsForHyperLogLog().size("Num");System.out.println("size = " + size);
}

注意:在Java中size对应PFCOUNT命令,add对应PFADD命令,union对应PFMERGE命令。在这里插入图片描述

插入结果:
在这里插入图片描述

此时我们查看Redis的内存使用情况:

  • used_memory:1500088(字节)
  • used_memory_human:1.43M
    在这里插入图片描述
    (1500088-1485704)/1024=14.04kb,可以看到内存使用极少!!
    因此当我们需要统计大数据量时不妨考虑考虑UV统计。
http://www.xdnf.cn/news/3538.html

相关文章:

  • Linux:系统延迟任务及定时任务
  • 柔性PZT压电薄膜多维力传感器在微创手术机器人的应用
  • [英语单词] from under
  • 【STM32】定时器
  • React memo
  • 《操作系统真象还原》调试总结篇
  • 在pycharm profession 2020.3上安装使用xlwings
  • 【CTFer成长之路】XSS的魔力
  • 个人健康中枢的多元化AI硬件革新与精准健康路径探析
  • JVM 如何使用性能分析工具定位代码中的性能问题?
  • 博弈论思维——AI与思维模型【90】
  • Elasticsearch 常用的 API 接口
  • npm,yarn,pnpm,cnpm,nvm,npx包管理器常用命令
  • 数字智慧方案5976丨智慧农业顶层设计建设与运营方案(59页PPT)(文末有下载方式)
  • npm命令介绍(Node Package Manager)(Node包管理器)
  • 2d 追加点
  • JDK-17 保姆级安装教程(附安装包)
  • 高等数学-第七版-下册 选做记录 习题9-7
  • 边缘检测算子对比:robert canny prewitt sobel laplace
  • VM虚拟机安装CentOS7.9
  • 实战应用MCP Server-SSE方式(url)
  • Calculus on Computational Graphs: Backpropagation
  • PHP-Cookie
  • Python10天突击--编译过程通常涉及几个关键步骤
  • 贪心算法精解(Java实现):从理论到实战
  • 博客打卡-人类基因序列功能问题动态规划
  • cv::remap() 和 cv::undistortion() 的区别
  • allure测试报告的应用
  • 「Mac畅玩AIGC与多模态11」开发篇07 - 使用自定义名言插件开发智能体应用
  • L3-040 人生就像一场旅行