ETH 3.0如何破局性能难题?一文揭秘背后的ZK技术突破与升级方案

bitget

Bitget交易所

Bitget交易所是全球前4大交易所之一、打新活动多、领空投到手软,新用户注册即可领取BGB空投

点击注册 进入官网

更多交易所入口

一站式注册各大交易所、点击进入加密世界、永不失联,币安Binance/欧易OKX/GATE.IO芝麻开门/Bitget

点击进入 永不失联

Beam Chain: “以太坊 3.0 ”

刚刚结束的 2024 Devcon 大会,热闹非凡,以太坊生态齐聚曼谷,以太坊及相关生态项目在此期间重磅发布最新进展及动态,一系列的新观点、新趋势、新计划点燃全球 Web3。

尤其让人印象深刻的,要属以太坊基金会研究员 Justin Drake 发布的“以太坊 3.0 ”提案计划。

他提出了一项被社区称为 “以太坊 3.0 ”的共识层升级提案 -- Beam Chain [ 1 ]。其核心观点是:用零知识证明减少 Validator 的计算和通信负担,降低成为 Validator 所需的门槛,使得更多的 Validator 可以加入网络以增加安全性、减少计算的冗余、提高网络整体的效率。此外,Justin 还想要借着对共识层 Snark 化改造的机会,解决 Beacon 链中由于时代限制留下的技术债,并为未来的抗量子安全需求做准备。

在 Vitalik 的 The Verge 路线图里,将以太坊 Snark 化(SNARKification)本就是其中一项重要工作,其包含对共识层和执行层进行零知识证明改造。 在 Vitalik 最新的解读里 [ 2 ],Vitalik 坦言对共识层的改造工作是一个挑战,需要在后续工作中持续地考虑并优化。Beam Chain 的提议,正好可以看作是 Vitalik 对共识层如何 Snark 化的一个回应。

Beam Chain 仅关注共识层。但将共识层 Snark 化并不代表着将所有部分都进行改造。区块链的核心是状态转换函数(State Transition Function),所以对其改造仅需将状态转换函数 Snark 化即可,这也正好是 ZK 所擅长的地方。对于共识层,状态转换函数主要包含三个部分,即 per-slot transition function、per-block transition function 和 per-epoch transition function。在这三个状态转换函数中,包含着共识算法和 Staking 逻辑的执行、区块提议、执行层结果正确性的验证、Merkle Tree Root 验证、共识签名的验证 / 聚合、哈希函数的计算、涉及到账户存储状态访问的质押和赎回操作等。要将共识层 Snark 化,其实就是将如上操作 Snark 化。值得注意的是,在将共识层 Snark 化的路线中,以太坊仍然将去中心化和多样性的目标放在首位,所以并不会强制要求 ZK 算法和协议,而是由 Proposer 自己选择。

图片来源:https://www.youtube.com/watch?v=rGE_RDumZGg&t=8257s

核心难点:Realtime Proving

要实现 Beam Chain 的构想,最核心的难点就是证明效率的提升,既如何将目前几十甚至上百秒的证明时间压缩到秒级。在今年 9 月 24 日由 AntChain OpenLabs、ZAN 和 Pharos 共同举办的 ZK Workshop II [ 3 ]上,嘉宾 Justin 分享了题为“Realtime Proving”的报告,彼时他提出的核心观点与“以太坊 3.0 ”设想一脉相承,提出了解决性能瓶颈的解决方案。其鼓励社区使用 ASIC 加速方法,在芯片上完成零知识证明虚拟机从证据生成到证明的全流程,在未来几年内将证明生成的时间提升十倍以上,真正能够实现 Realtime Proving。

为零知识证明技术的性能与应用助力:我们一直在路上

AntChain OpenLabs 一直致力于利用 GPU、FPGA、ASIC 等硬件平台对 ZK 证明进行加速,加速了包括 Polygon ZKEVM Prover、Stone Prover、Halo 2 和 Plonky 2 在内的多种 ZK 系统,形成了多个 FPGA IP 和 GPU 加速解决方案,部分核心算子达到百倍以上加速比。

AntChain OpenLabs 基于 CUDA 加速的部分算子的相对 CPU 获得的加速比,如表 ( 一 )。

( 表一 )

AntChain OpenLabs 实现的 GPU 加速的 MSM 与开源 ICICLE 的性能对比(均为 409 0G PU),如表(二)。

( 表二 )

AntChain OpenLabs 实现的 GPU 加速的 Circle FFT 与在 16 核 CPU 上开源 Stwo Prover 的性能对比,如表(三)。

( 表三 )

此外,AntChain OpenLabs 还致力于零知识证明的应用探索,在 AI+ZK 方向的大模型可验证计算上,使用自主设计的矩阵乘法 Folding、Sumcheck 协议的 GPU+CPU 协同优化、椭圆曲线高效实现等技术,在 4 个 GPU 下将 zkLLM [ 4 ][ 5 ](原实现不包括承诺和打开,性能为加入承诺和打开之后测试,针对 LLama-7 B 模型)的首 token 生成时间由 4 小时降低到约 18 分钟。

AntChain OpenLabs 基于 GPU 方面的积累不断优化大模型可验证计算的性能和可用性,并在承诺方案替换和优化、多实例 Folding、多 token 证明生成方面持续发力,目标构建一个高效、易用、AI 生态友好的可验证计算服务,为零知识证明技术的大规模应用探明可能方向,构建 Web3 和 AI 应用链接的桥梁。

同时面对量子计算机的威胁,AntChain OpenLabs 也进行了积极探索,基于 OpenSSL [ 6 ]改造了一个后量子版本密码库,支持多个 NIST 标准后量子算法。同时面对后量子签名较 ECDSA 有 40 倍以上存储膨胀的问题,通过共识流程以及低延迟内存读取优化,使得抗量子区块链 TPS 可达原链的 50% 左右。

值得关注的是,上述技术探索已在 ZAN 推出的软硬一体加速方案——Power Zebra (https://zan.top/home/power-zebra?chInfo=ch_WZ) 中应用落地,该方案针对零知识证明常用的算子进行加速和优化,包括多标量点乘 MSM、数论变换 NTT、H 多项式求解、多项式打开证明等多个关键组件,充分利用了 GPU 的计算资源、存储带宽和 PCIe 带宽,使得运算效率显著提升。此前 zkWASM 开源社区 Delphinus Lab 在引入 ZAN 的软硬一体加速方案 Power Zebra 后,GPU 运算性能提升超 20% ,创造社区同类服务最高记录。

预见

长久以来,以太坊社区主要聚焦于执行层的各项优化,包括提高 BlockGasLimit、L2s 等策略。在这其中,执行层的 Snark 化早已在「Rollup Centric」的路线图中借助 L2 完成了大部分工作,收获颇丰。Beam Chain 的想法,则打开了共识层 Snark 化的大门。相信随着 Beam Chain 的提出,会引导和激发社区将目光投入共识层的改造中,带来更多令人激动的想法。

可以预想到,共识层和执行层的 Snark 化,将一起完成 Ethereum Snark 化的最终拼图,为以太坊的扩展性、去中心化作出巨大贡献。同时,随着 Beam Chain 提案的推进,基于零知识证明技术的虚拟机将在以太坊生态中扮演核心角色。通过引入 SNARK 证明和后量子密码学,结合更低的质押门槛以及更快的区块确认时间,Beam Chain 将为以太坊带来更强的去中心化和更高的性能。

参考文献

[ 1 ] https://www.youtube.com/watch?v=rGE_RDumZGg

[2] https://vitalik.eth.limo/general/2024/10/23/futures4.html

[3] https://x.com/zan_team/status/1844947080642539752

[4] https://github.com/jvhs0706/zkllm-ccs2024

[5] https://arxiv.org/abs/2404.16109

[6] https://www.openssl.org/

bitget

Bitget交易所

Bitget交易所是全球前4大交易所之一、打新活动多、领空投到手软,新用户注册即可领取BGB空投

点击注册 进入官网

更多交易所入口

一站式注册各大交易所、点击进入加密世界、永不失联,币安Binance/欧易OKX/GATE.IO芝麻开门/Bitget

点击进入 永不失联

目录[+]