当前位置: 首页 > news >正文

浅谈 ST 表(Sparse Table,稀疏表)

前置知识

如何快速求出 ⌊ log ⁡ 2 x ⌋ \lfloor\log_2x\rfloor log2x

这里有几种方法。

  • O ( n ) \mathcal O(n) O(n) 打表,在 ST 表的应用中只需要打数字数量级别的表就行。
  • 使用不可移植的 GCC 内部函数。
  • 标准做法是使用 C++20 的 bit_width 函数再 − 1 -1 1,注意目前 NOI 系列比赛不能用。
  • O ( log ⁡ log ⁡ n ) \mathcal O(\log \log n) O(loglogn) 的倍增做法。

四种方法的代码见下。

enum class qwq123_mode
{GetTable,GCCInnerFunc,BitWidth,Binary,Default = Binary // 此处 Binary 可以换成上面的任意一个值
};
constexpr int value_range = 100005; // 值域(用于打表)
unsigned qwq123(unsigned x)
{switch(qwq123_mode::Default){case qwq123_mode::GetTable:// 定义表类型,原因见下class TableType{int* table;public:TableType(){table = new int[value_range + 1];table[1] = 0;for (int i = 2; i <= value_range; i++){table[i] = table[i >> 1] + 1;}}int get(int x) { return table[x]; }};// 使用语法糖实现自动打表// 利用 static 变量第一次声明自动初始化static TableType tt;return tt.get(x);case qwq123_mode::GCCInnerFunc: return 31 - __builtin_clz(x);case qwq123_mode::BitWidth: return bit_width(x) - 1;case qwq123_mode::Binary: // 通常来讲,unsigned 比 int 快// 前提是不开编译器优化。聪明一点的编译器// 都会把可以用 unsigned 的 int// 替换成 unsigned。unsigned res = 0;// 事实上,应该是 res += 16// 但是其实两者等价。不开编译器优化时// |= 明显更快。if (x >> 16) { res |= 16; x >>= 16; }if (x >> 8) { res |= 8; x >>= 8; }if (x >> 4) { res |= 4; x >>= 4; }if (x >> 2) { res |= 2; x >>= 2; }// 最后不需要调整 x 了。if (x >> 1) { res |= 1; }return res;}
}

下面是测速结果。

意料之中地,GCC 内部函数做法最快,标准做法其次。

算法介绍

ST 表(又名稀疏表,Sparse Table),是一种支持静态 RMQ 问题的数据结构。

什么是 RMQ 问题?是 Range Maximum/Minimum Query 的缩写,表示区间最值。其实,ST 表不仅可以处理 RMQ 问题,还可以处理所有满足可重复贡献且满足结合律的问题(没错,这一段就是从 OI-wiki 上抄的)。设操作为 f ( x , y ) f(x,y) f(x,y),可重复贡献是指 f ( x , x ) = x f(x,x)=x f(x,x)=x,而满足结合律是指 f ( x , f ( y , z ) ) = f ( f ( x , y ) , z ) f(x,f(y,z))=f(f(x,y),z) f(x,f(y,z))=f(f(x,y),z)下面我们都假设操作为 max ⁡ \bm{\max} max 操作。

它其实是一个二维数组。通常情况下,我们使用 f i , j f_{i,j} fi,j 表示 max ⁡ k = i i + 2 j − 1 a k \displaystyle\max_{k=i}^{i+2^j-1}a_k k=imaxi+2j1ak,但是事实证明这种表示方法并不是很好。

为什么?第一个原因是因为 cache 不友好,为啥不友好详见后面的预处理部分。第二个原因是因为作者常写的边度边预处理在这种表示法下不好写也不好看,作者习惯的是 f j , i = max ⁡ k = i − 2 j + 1 i a k \displaystyle f_{j,i}=\max_{k=i-2^j+1}^{i}a_k fj,i=k=i2j+1maxiak以下都用这种表示方法。

测速结果(均使用 GCC 内置函数算 log ⁡ \log log):

预处理

显然是递推。

我们注意到区间 [ x , x + 2 j ) [x, x+2^j) [x,x+2j) 可以分为两部分, [ x , x + 2 j − 1 ) [x,x+2^{j-1}) [x,x+2j1) [ x + 2 j − 1 , x + 2 j ) [x+2^{j-1},x+2^j) [x+2j1,x+2j)(看过我的线段树文章的估计对这个东西比较熟悉)。递推即可。递推式为 f i , j = max ⁡ ( f i − 1 , j , f i − 1 , j − 2 i − 1 ) f_{i,j}=\max(f_{i-1,j},f_{i-1,j-2^{i-1}}) fi,j=max(fi1,j,fi1,j2i1),时间复杂度显然是 O ( n log ⁡ n ) \mathcal O(n \log n) O(nlogn),显然这个递推式是时间复杂度上最优的。

我们发现一件事情:转移顺序?

显然第一维从 i i i 还是 j j j 开始转移都没毛病。然而,显然先枚举 j j j 的做法难以处理“在 ST 表之后添加数字”,而先枚举 i i i 可以,所以通常情况下我们先枚举 j j j

查询

现在可重复贡献的优势就来了。

x , y x,y x,y 是两个集合,则显然 max ⁡ ( max ⁡ i ∈ x i , max ⁡ i ∈ y i ) = max ⁡ i ∈ x ∪ y i \displaystyle\max\left(\max_{i \in x} i,\max_{i\in y}i\right)=\max_{i \in x \cup y}i max(ixmaxi,iymaxi)=ixymaxi

那么如果 x ∪ y = [ a , b ] x \cup y = [a,b] xy=[a,b],那么取 k = 2 log ⁡ ( b − a + 1 ) k=2^{\log(b-a+1)} k=2log(ba+1),构造 x = [ a , a + 2 k − 1 ] x=[a,a+2^k-1] x=[a,a+2k1] y = [ b − 2 k + 1 , b ] y=[b-2^k+1,b] y=[b2k+1,b],容易发现满足条件,且都可以使用 ST 表中的元素表示。时间复杂度取决于 k k k 的计算复杂度,通常视为 Θ ( 1 ) \Theta(1) Θ(1)

正确性证明

好好看文章。

已经在上面详细解释了。

代码实现

#include <bit>
#include <cstdio>
#include <algorithm>using namespace std;int a[100005], st[25][100005];
enum class qwq123_mode
{GetTable,GCCInnerFunc,BitWidth,Binary,Default = GCCInnerFunc
};
constexpr int value_range = 100005; // 值域
unsigned qwq123(unsigned x)
{switch(qwq123_mode::Default){case qwq123_mode::GetTable:// 定义表类型,原因见下class TableType{int* table;public:TableType(){table = new int[value_range + 1];table[1] = 0;for (int i = 2; i <= value_range; i++){table[i] = table[i >> 1] + 1;}}int get(int x) { return table[x]; }};// 使用语法糖实现自动打表// 利用 static 变量第一次声明自动初始化static TableType tt;return tt.get(x);case qwq123_mode::GCCInnerFunc: return 31 - __builtin_clz(x);case qwq123_mode::BitWidth: return bit_width(x) - 1;case qwq123_mode::Binary: // 通常来讲,unsigned 比 int 快// 前提是不开编译器优化。聪明一点的编译器// 都会把可以用 unsigned 的 int// 替换成 unsigned。unsigned res = 0;// 事实上,应该是 res += 16// 但是其实两者等价。不开编译器优化时// |= 明显更快。if (x >> 16) { res |= 16; x >>= 16; }if (x >> 8) { res |= 8; x >>= 8; }if (x >> 4) { res |= 4; x >>= 4; }if (x >> 2) { res |= 2; x >>= 2; }// 最后不需要调整 x 了。if (x >> 1) { res |= 1; }return res;}
}int main()
{int n, m;scanf("%d%d", &n, &m);for (int i = 1; i <= n; i++){scanf("%d", st[0] + i);for (int j = 1; (i - (1 << j)) >= 0; j++){st[j][i] = max(st[j - 1][i], st[j - 1][i - (1 << (j - 1))]);}}for (int i = 1; i <= m; i++){unsigned x, y;scanf("%u%u", &x, &y);unsigned len = y - x + 1, llen = qwq123(len), lllen = 1 << llen;printf("%d\n", max(st[llen][x + lllen - 1], st[llen][y]));}return 0;
}

record。

http://www.xdnf.cn/news/950581.html

相关文章:

  • 基于ffmpeg+sdl的audio player
  • uniapp 实现腾讯云IM群文件上传下载功能
  • 基于亚博K210开发板——WiFi 模块联网
  • C语言 学习 文件操作(开关,读写,定位,大小)操作 2025年6月8日12:19:24
  • C语言 学习 模块化编程 2025年6月9日19:39:17
  • 论文阅读笔记——Muffin: Testing Deep Learning Libraries via Neural Architecture Fuzzing
  • 触发DMA传输错误中断问题排查
  • Redis哨兵模式以及主从
  • LLM基础5_从零开始实现 GPT 模型
  • CMIP6气候模式资料概览
  • 免费在线PDF转图片工具
  • gephi绘制网络拓扑图:批量给节点着色
  • nginx安装和部署
  • 免费PDF转图片工具
  • NVIDIA CUDA 技术详解:开启 GPU 并行计算的大门
  • CocosCreator 之 JavaScript/TypeScript和Java的相互交互
  • 创建型模式-单例模式
  • Python网页自动化Selenium中文文档
  • 24.解释器模式:思考与解读
  • 从零手写Java版本的LSM Tree (四):SSTable 磁盘存储
  • 9个数据分析指令为工作赋能
  • 升级背后:CANOPEN转MODBUS TCP技术如何实现精准控制?
  • 精益数据分析(97/126):邮件营销与用户参与度的关键指标优化指南
  • SFTrack:面向警务无人机的自适应多目标跟踪算法——突破小尺度高速运动目标的追踪瓶颈
  • C# 表达式和运算符(求值顺序)
  • 李沐--动手学深度学习--GRU
  • RNN避坑指南:从数学推导到LSTM/GRU工业级部署实战流程
  • 人工智能与无人机的组合如何撕开俄空天军的 “核心“
  • [docker]镜像操作:关于docker pull、save、load一些疑惑解答
  • ubuntu 22.04搭建SOC开发环境