当前位置: 首页 > news >正文

数据库的原子事务

在这里插入图片描述

原子事务

11.1 全有或全无效应

二级索引需要原子性的多键更新,这不仅对数据库内部一致性至关重要,也对应用数据的一致性非常有用(例如考虑账户余额和账户交易)。

我们将放弃get-set-del接口,并添加一个新的接口来允许一组操作的原子执行。并发控制将在下一章讨论。

提交与回滚

我们将添加接口以标记事务的开始和结束。在结束时,更新要么生效(提交),要么由于错误或用户请求(中止)被丢弃(回滚)。

// 开始一个事务
func (kv *KV) Begin(tx *KVTX)// 结束一个事务:提交更新;发生错误则回滚
func (kv *KV) Commit(tx *KVTX) error// 结束一个事务:回滚
func (kv *KV) Abort(tx *KVTX)
写时复制实现原子性

通过写时复制(copy-on-write),无论是提交还是回滚都只是更新根指针。这已经在第6章作为错误处理实现了。

type KVTX struct {db   *KVmeta []byte // 用于回滚
}func (kv *KV) Begin(tx *KVTX) {tx.db = kvtx.meta = saveMeta(tx.db)
}func (kv *KV) Commit(tx *KVTX) error {return updateOrRevert(tx.db, tx.meta)
}func (kv *KV) Abort(tx *KVTX) {loadMeta(tx.db, tx.meta)tx.db.page.nappend = 0tx.db.page.updates = map[uint64][]byte{}
}

以前updateOrRevert()是在单个键更新后调用的。现在它被移动到了KVTX.Commit()。B+树可以根据需要多次更新,重要的是根指针。

另一种方法是通过日志实现原子性,在写时复制树中,更新由根指针捕获,而在原地更新中,则需要日志来捕获更新。

11.2 事务性接口

将树操作移到事务中

树操作现在与事务关联,因此它们被移到了KVTX中。

func (tx *KVTX) Seek(key []byte, cmp int) *BIter {return tx.db.tree.Seek(key, cmp)
}func (tx *KVTX) Update(req *UpdateReq) bool {return tx.db.tree.Update(req)
}func (tx *KVTX) Del(req *DeleteReq) bool {return tx.db.tree.Delete(req)
}

注意,这些函数不再返回错误,因为实际的磁盘更新被移到了KVTX.Commit()中。

事务表操作

对于基于表的接口,只需为KVTX添加一个包装类型。

type DBTX struct {kv KVTXdb *DB
}func (db *DB) Begin(tx *DBTX)
func (db *DB) Commit(tx *DBTX) error
func (db *DB) Abort(tx *DBTX)func (tx *DBTX) Scan(table string, req *Scanner) error
func (tx *DBTX) Set(table string, rec Record, mode int) (bool, error)
func (tx *DBTX) Delete(table string, rec Record) (bool, error)

这些操作不再处理IO错误,因此没有更新二级索引的错误处理。

11.3 可选优化

尽管我们已经建立了一个支持顺序操作的关系型数据库系统,但为了进一步挑战,还有一些优化可以考虑:

  • 减少多键更新时的复制:写时复制在一次更新中从叶节点到根节点复制节点,这对于多键更新来说不是最优的,因为中间树的节点在一个事务内分配、更新一次然后被删除。优化方法是在一个事务内只复制一次节点,并在复制的节点上使用原地更新。

  • 范围删除:虽然我们现在可以进行多键更新,但删除大量键(如删除表)仍然存在资源使用的难题。简单的做法是一次迭代并逐个删除键,但这会将整个表读入内存并在删除前反复更新节点,做了一些无用的工作。一些数据库对每个表使用单独的文件,所以这不是问题。在我们的案例中,所有内容使用单一的B+树,我们可以实现一个范围删除操作,无需查看即可释放具有特定范围的所有叶节点。

  • 压缩公共前缀:在任何排序的数据中,邻近的键可能共享一个公共前缀。在典型的关系数据库使用场景中,多列键也会导致共享前缀。因此有机会压缩节点内的键。前缀压缩使实现更加复杂(有趣),尤其是在合并和分裂时节点大小不容易预测的情况下。

代码仓库地址:database-go

http://www.xdnf.cn/news/294733.html

相关文章:

  • Cursor报错Your request has been blocked解决方案
  • JavaSE核心知识点01基础语法01-02(基本数据类型、运算符、运算符优先级)
  • 【信息系统项目管理师-论文真题】2006下半年论文详解(包括解题思路和写作要点)
  • 学习黑客Nmap 命令法诀
  • 深入浅出数据库的函数依赖关系
  • 数据库原理——E-R图的极速省流理解 例题解析
  • 编译与链接
  • APEX和AI Vector免费认证报名流程分享
  • 融智学核心范式的数学表述:融智学范式革命的总括性阐释——一场文明认知的量子跃迁
  • linux 交叉编译报错 ERROR: sdl2 requested but not found
  • Gradio全解20——Streaming:流式传输的多媒体应用(6)——构建视频流目标检测系统
  • 【NLP】29. 高效训练与替代模型:让语言模型更轻、更快、更强
  • 暂停线程的三种方式:join、sleep、yield
  • 教育应用场景下多智能体系统中交互模型的案例迁移
  • 大模型的监督学习和非监督学习
  • linux种文件名usr的含义是什么?
  • General Tutor 提示词延申分析
  • 11.施工监测
  • Gradio全解20——Streaming:流式传输的多媒体应用(4)——基于Groq的带自动语音检测功能的多模态Gradio应用
  • 18. 四数之和-python刷题-灵神
  • 1257: 【基础】马鞍数
  • 力扣hot100 (除自身以外数组的乘积)
  • Pinia状态管理工具速成
  • 认识并理解什么是链路层Frame-Relay(帧中继)协议以及它的作用和影响
  • 【C/C++】无锁编程——compare_exchange_strong
  • 第二章 - 软件质量
  • S100平台调试RS485/RS232
  • Python Cookbook-7.2 使用 pickle 和 cPickle 模块序列化数据
  • 【Python】 `os.getenv()` vs. `os.environ.get()`:环境变量获取方式的本质差异解析
  • Milvus(14):更改 Collections 字段、Schema 设计实践