当前位置：首页 > news >正文

LevelDB介绍和内部机制

news 2025/6/13 13:35:14

介绍

LevelDB 是 Google 开源的高性能键值对嵌入式数据库，具有一系列设计上的优势，特别适合写多读少、对存储空间要求高效的场景。

场景类型	原因
高并发读场景（每秒几千次以上）	读放大严重，需大量优化（如加 Bloom Filter、前置缓存）
大量随机读 + 大量随机写	写放大 + 查询慢
多表 join、事务一致性需求强	不支持 SQL 和事务
需要按字段查询、复杂查询	不支持索引，只有键排序

它是数据库打开时创建的空内存结构，用于接收写入。

DB.open() 时，创建一个空的 memTable。
写入数据时（put()/delete()），首先写 WAL（Write-Ahead Log），然后写入 memTable。
当 memTable 的大小超过阈值（writeBufferSize）时，会：
- 将当前 memTable 移入 immutable memTable；
- 异步触发 flush 操作，将其写入 .sst 文件；
- 创建新的 memTable 接收写入。

compactionScore 是 LevelDB 内部的一个关键指标，它决定是否需要触发 Compaction（压缩），以及优先压缩哪个 Level。

参数	默认值	说明
`createIfMissing`	`false`	如果数据库不存在，是否自动创建（通常你会手动设为 `true`）
`errorIfExists`	`false`	如果数据库已存在，是否抛出异常
`paranoidChecks`	`false`	是否进行一致性检查
`verifyChecksums`	`false`	读取时是否校验数据块的校验和
`cacheSize`	`8 * 1024 * 1024`（8MB）	内存缓存大小
`blockSize`	`4 * 1024`（4KB）	每个 block 的大小
`writeBufferSize`	`4 * 1024 * 1024`（4MB）	写缓冲区大小
`maxOpenFiles`	`1000`	打开的文件数上限（仅 native JNI 实现中有效）
`compressionType`	`Snappy`	是否启用 Snappy 压缩

写入 WAL（Write-Ahead Log）
1. 写入先追加到 .log 文件（顺序写）；
2. 保证宕机后数据可恢复；
3. 默认采用 同步写（Sync=true）才能确保持久化；
4. .log 文件位于 Level 0。
写入 memTable（跳表）
1. 同步写入内存结构 memTable；
2. 快速写入（无锁 skiplist），数据可被读取；
3. 内存中结构，不会持久化；
4. 达到 writeBufferSize 限制（默认 4MB）后变为 immutable memTable，进入 flush。
触发 MemTable Flush，生成 SST 文件
1. 将 immutable memTable 转为 SST 文件；
2. 写入磁盘（SST 为排序存储）；
3. 这些文件是查询的主要来源（也是 compaction 的输入）；
4. 会和已有 Level 0 文件产生重叠。
进行 Compaction（压缩）
1. 定期触发（或写压力大时自动触发）；
2. 将多个 SST 文件合并、去重、合并覆盖；
3. 数据从 L0 -> L1 -> L2 逐层下推；
4. 保证后期查询高效，数据唯一性提升。

执行 db.put("user123", "value1")，可能流程如下：

先查 memTable（内存表）
1. memTable 是当前活跃写入的跳表结构；
2. 有序、支持二分查找；
3. 如果找到了 key，直接返回对应的 value。
再查 immutable memTable（只读内存表）
1. memTable flush 到磁盘前，会被转为 immutable；
2. 查询会优先在这查找；
3. 如果 key 存在，会返回。
然后查各层 .sst 文件（从 Level 0 开始）
1. Level 0：
  1. 文件之间的 key 区间可能重叠；
  2. 必须逐个文件遍历查找；
  3. 优先查最新的文件（文件编号大 → 数据新）；
2. Level 1~N（通常到 Level 6）：
  1. 每层中的文件 key 区间互不重叠；
  2. 可以通过 key 二分定位到最多一个文件；
  3. 只需要在该文件中查找一次；
使用 Bloom Filter 加速排除（配置生效）
1. 每个 .sst 文件都可带一个 Bloom Filter；
2. 在读文件前先看 Bloom Filter 是否可能包含该 key；
  1. 否 → 立即跳过；
  2. 是 → 真正读取磁盘文件；
3. 可大幅降低磁盘 IO 次数，特别是 key 不存在时。
读取 Block → 解压缩 → 查找 KV
1. .sst 文件是由多个 Block 组成的；
2. 使用索引块定位 block；
3. 如果有 Snappy 压缩，先解压再查找；
4. 查到 key 返回 value，否则继续查下一个层级。