Shrubs提出Merkle树的变种只用一个树根节点代表整棵树_微阅读_自媒体阅读聚合平台

　　【摘要】这几天在日本大阪正在举办Devcon 5。议题中有个topic吸引我的眼球：在以太坊上，传统的Merkle树(深度为33)添加一个叶子节点，除了计算33次Hash函数外，

这几天在日本大阪正在举办Devcon 5。议题中有个topic吸引我的眼球：

在以太坊上，传统的Merkle树(深度为33)添加一个叶子节点，除了计算33次Hash函数外，还需要更新33个节点(也就是需要读并且更新33个存储空间)。而更新一个节点的存储费用是昂贵的。更新33个256bit的存储，大约需要180w的GAS费用。

Shrubs就提出了一种Merkle树的变种，每次添加一个叶子节点，只需要O(1)次存储更新。这种变种的Merkle树，不只是用一个树根节点来“代表”整棵树。而是用一系列节点(个数等于深度)来代表“整棵树，保证所有的叶子节点都能”索引“到这些节点。在变种的Merkle上，每一层选择一个节点。在添加叶子节点的时候，在不破坏其他“子树”的根的前提下，只要更新到离该叶子节点最近的子树根即可。

可以想象成，Shrubs的变种Merkle树，其实是由一棵棵的子树的树根组成。这些子树能覆盖所有的已经添加的叶子节点。这些子树的树根可以代表一棵完整的Merkle树(唯一性)。而且通过子树的路径证明，就能证明某个叶子节点在这颗完整的Merkle树上。因为每次只需要更新子树的树根，所以，每次添加叶子节点只需要一次节点数据的更新。

这些子树的树根，又能推导出整个merkle树最右边的path。这也是，Shrubs的说明中，用merkle树的最右边path代表merkle树的原因。

1. 核心算法

Shrubs的变种Merkle树的算法原型昨天更新到Github上，地址如：https://github.com/celo-org/shrubs

核心算法逻辑在contracts/MerkleTreeLib.sol中的insert和verify函数。

1. 插入节点

insert函数实现了叶子节点的插入逻辑。filled_subtrees就是每个选择的子树的根。insert函数的主要逻辑，就是选择子树，更新子树的根。

function insert(uint256 leaf) internal {

uint32 leaf_index = next_index;

uint32 current_index = next_index;

next_index += 1;

uint256 current_level_hash = leaf;

uint256 left;

uint256 right;

bool all_were_right = true;

for (uint8 i = 0; i < levels; i++) {

if (current_index % 2 == 0) {

left = current_level_hash;

right = zeros[i];

filled_subtrees[i] = current_level_hash;

break;

} else {

left = filled_subtrees[i];

right = current_level_hash;

}

current_level_hash = HashLeftRight(left, right);

current_index /= 2;

}

tree_leaves.push(leaf);

}

filled_subtrees采用空节点初始化。在新插入一个节点时，找到它最低的左节点作为选择的子树，并更新树根。current_index是每一层上节点的序号。选择左边节点是通过current_index%2==0实现。

以深度为4的Merkle树为例，添加第一个叶子节点后，各个子树的树根如下(青色节点是初始化的filled_subtrees节点，蓝色是更新的节点)：

添加第二和三个叶子节点分别如下：

整个添加过程如下面动图效果(橙色连线代表hash计算)：

1.2 验证节点

verify函数是验证某个叶子节点在Merkle树上的示例。只要能给定一条路径，能计算出一个子树根即可。

function verify(uint256 leaf, uint256[] memory path, uint32 leaf_index) internal {

uint32 current_index = leaf_index;

uint256 current_level_hash = leaf;

uint256 left;

uint256 right;

for (uint8 i = 0; i < levels; i++) {

if (mode == 0 && filled_subtrees[i] == current_level_hash) {

emit LeafVerified(leaf, leaf_index, i, true);

return;

}

if (current_index % 2 == 0) {

left = current_level_hash;

right = path[i];

} else {

left = path[i];

right = current_level_hash;

}

current_level_hash = HashLeftRight(left, right);

current_index /= 2;

}

2. 性能分析

2.1 数据更新

Shrubs变种Merkle树，每次添加节点，只需要更新一个子树的树根。从数据更新角度，算法复杂度O(1)。

2.2 hash计算

从hash计算的角度，在添加左节点时，无需hash计算。在添加右节点时，hash计算和选择的子树深度相等。越靠右的节点，子树选择也高，hash计算也越多。即使这样，也比传统的Merkle树计算量小。

假设Merkle树的树高是n，则传统Merkle树添加所有的叶子节点，需要2^n*n次计算。Shrubs变种Merkle树添加所有的叶子节点，只需要(1+2+...+n) = (n*(n-1))/2次计算

3. 测试结果

在Devcon5上，Shrubs公开了变种Merkle树的测试结果。叶子插入的gas消耗，平均情况下，9.6w。

图中，Shrubs最坏情况下的GAS消耗应该不是168w，应该在40w左右。

如果使用Groth16零知识证明的话，大约需要不到50w的GAS(EIP1008情况下)。

值得一提的是，使用Groth16零知识证明，需要将所有的子树的树根作为public input。

总结：

为了解决以太坊智能合约中Merkle树更新存储开销较大的问题，Shrubs提出了一种新型的Merkle树变种。这种变种的Merkle树用多个子树的树根来代表一个Merkle树。每次添加一个叶子节点，只需要O(1)次存储更新，平均情况下，只需要9.6w的GAS。使用Groth16算法，证明叶子节点在树上，也只需要不到50w的GAS。（Star Li）

Shrubs提出Merkle树的变种 只用一个树根节点代表整棵树

Shrubs提出Merkle树的变种只用一个树根节点代表整棵树