当前位置：首页 > backend >正文

肖臻《区块链技术与应用》第16讲 - 以太坊的“世界状态”：从哈希表到MPT架构演进

backend 2025/8/26 6:39:27

摘要：
以太坊采用的账户模型虽然直观，却带来了一个巨大的技术挑战：如何高效地存储并加密地保证全网数百万账户与各自状态之间的映射关系？本文基于北京大学肖臻老师的公开课内容，以一种追根溯源的方式，探讨了以太坊核心数据结构的设计演进。文章将带领读者经历一场逻辑推演，从分析为何哈希表、默克尔树等简单方案无法满足需求，到最终揭示以太坊的精妙解决方案——默克尔帕特里夏树（Merkle Patricia Trie）。我们将理解这一复杂结构如何集各家之长，实现了高效更新、状态证明和历史版本回溯等关键功能。

1. 问题的提出：如何存储全网账户？

以太坊是一个基于账户的模型，其核心任务是维护一个“世界状态”（World State），即一个从唯一的账户地址（Address）到该账户状态（Account State，包含余额、Nonce等）的映射。

从计算机科学的角度看，这是一个典型的键值对（Key-Value Pair）存储问题。那么，应该采用什么样的数据结构来实现这个映射呢？

2. 失败的探索：为何简单的方案行不通？

让我们跟随肖臻老师的思路，从最直观的方案开始探索，并分析它们各自的致命缺陷。

2.1 方案一：哈希表——高效但无法证明

优点： 哈希表在插入、查询和更新操作上具有极高的效率（平均时间复杂度为O(1)）。
致命缺陷：无法高效地生成默克尔证明（Merkle Proof）。
- 为了让轻节点能够验证某个账户的状态（如余额），全节点必须提供一个加密的证明。这就需要将所有账户数据组织成一棵默克尔树，并计算出一个唯一的根哈希（Root Hash）存入区块头。
- 如果使用哈希表，意味着每产生一个新区块（约15秒），全节点都必须遍历全部数百万个账户，重新构建一棵庞大的默克尔树。这个计算开销是完全无法接受的。
- 对比比特币： 比特币的默克尔树只包含单个区块内的几百到几千笔交易，且每次都是构建一棵全新的、不可变的树，因此计算开销可控。而以太坊需要对一个庞大的、可变的“全网账户状态”进行操作。

2.2 方案二：默克尔树——可证明但笨拙

优点： 直接使用默克尔树，天然就解决了状态证明和全网状态一致性（通过对比根哈希）的问题。
致命缺陷：更新和查询效率低下，且根哈希不唯一。
- 效率问题： 传统的默克尔树并非为快速查找或更新单个叶子节点而设计。
- 根哈希不唯一： 如果不对叶子节点（账户）的顺序进行规定，那么不同的全节点在本地构建出的默克尔树结构将会不同，计算出的根哈希也不同，从而导致共识崩溃。
- 排序也没用： 如果我们强制要求所有节点按账户地址对叶子节点进行排序（Sorted Merkle Tree），虽然能保证根哈希唯一，但又会引入新的问题：当一个新账户（其地址是随机的）被创建时，它很可能需要插入到树的中间位置，这将导致树的大规模重构，其开销同样巨大。