作者:Vitalik Buterin
翻译:白话区块链
Vitalik在周一的博文中,讨论了之前进行合并(Merge)后的发展现状,并提出了对以太坊权益证明模型的几项潜在改进建议。其中包括降低个人质押者的资金门槛,以及缩短以太坊区块确认的时间。今天,他又再次发表新闻讨论了扩展(Surge)的现状及要改进的工作。 以下为正文:
最初,以太坊的路线图中有两种扩展策略。一种(例如,请参见2015年的早期论文)是“分片”;另一种策略是二层协议。2015年,“二层协议”指的是状态通道,2017年是Plasma,2019年则是Rollups。Rollups比状态通道或Plasma更强大,但它们需要大量的链上数据带宽。幸运的是,到了2019年,分片研究已经解决了大规模验证“数据可用性”的问题。结果,这两条路径逐渐合并,形成了今天以Rollups为中心的路线图,成为以太坊当前的扩展策略。
The Surge, 2023 版路线图.
以Rollups为中心的路线图提出了一个简单的分工模式:以太坊L1专注于成为一个强健且去中心化的基础层,而L2则负责帮助生态系统扩展。
今年,以Rollups为中心的路线图取得了重要进展:通过EIP-4844提案,以太坊L1的数据带宽得到了极大的提升,并且多个EVM汇总已经进入第一阶段。现在,每个L2都作为一个拥有自己规则和逻辑的“分片”存在,形成了一种高度异质且多元的分片实现。但正如我们所见,选择这条道路也带来了独特的挑战。因此,我们的任务就是完善以Rollups为中心的路线图,解决这些问题,同时保持以太坊L1的强健性和去中心化的特性。
The Surge 的关键目标
-
L1和L2合计达到100,000+ TPS
-
保持L1的去中心化和强健性
-
至少有一些L2完全继承以太坊的核心属性(无信任、开放、抗审查)
-
L2之间实现最大程度的互操作性。以太坊应该像一个统一的生态系统,而不是34条不同的区块链。
本文目录
1、背景:可扩展性三难困境
2、数据可用性采样的进一步进展
3、数据压缩
4、通用化Plasma
5、L2证明系统的成熟化
6、跨L2互操作性的改进
7、L1上的执行扩展
1、背景:可扩展性三难困境
可扩展性三难困境是2017年提出的一个概念,强调区块链中去中心化、可扩展性和安全性之间难以平衡。虽然打破这一困境并非不可能,但实现难度较大。
一些高性能链声称通过软件工程技巧解决了三难困境,但这种说法通常具有误导性,因为在这些链上运行节点的难度往往大于以太坊。
然而,数据可用性采样与SNARK的结合能够有效解决三难困境,允许客户端以较少的数据下载量验证数据的可用性并确认计算步骤的正确性。SNARK是无信任的,而数据可用性采样则保留了即使遭受51%攻击时,恶意区块也不被网络接受的特性。
Plasma架构也是解决三难困境的一种方法,它通过激励机制保持兼容性,将数据可用性的监控责任转移给用户。尽管在2017-2019年间由于依赖欺诈证明而限制了Plasma的安全应用范围,但随着SNARK的普及,Plasma架构在更广泛场景中的安全性得到了增强。
2、数据可用性采样的进一步进展
1)我们要解决的问题是什么?
截至2024年3月13日,Dencun升级后,以太坊每12秒的插槽支持约375KB的数据带宽,最大汇总TPS约为173.6。若计算calldata,最大TPS可提升至607。通过PeerDAS,计划将数据块数量增加到8-16个,预计TPS可达463-926。尽管这些提升显著,但仍需更高的可扩展性,中期目标为每个插槽16MB,结合数据压缩实现约58,000 TPS。
2)它是什么以及如何工作?
PeerDAS是一种基于一维采样的数据可用性实现,利用度4096的多项式和每个份额的16次评估来恢复数据块。每个客户端监听少数子网,通过点对点网络获取其他子网的数据块。更保守的SubnetDAS仅依赖子网机制。目标是将数据块数量增加到256,以实现每个插槽16MB的数据量,数据可用性采样的成本为每个插槽1MB带宽。虽然可行,但带宽有限的客户端无法进行采样。最终目标是推进到二维采样,利用KZG承诺扩展数据块集,从而简化分布式区块构建的过程。
3)尚待完成的工作及权衡
下一步是实施和推广PeerDAS,逐步增加数据块数量,并监控网络和改进软件以确保安全。同时,需要更多学术研究来形式化PeerDAS及其他版本的DAS,并探讨它们与分叉选择规则的安全性。长期目标是确定理想的二维DAS版本并证明其安全性,最终迁移到一种量子抗性、无需可信设置的替代方案来取代KZG。目前尚未找到适合分布式区块构建的候选方案,即使使用递归STARK生成有效性证明,也存在大小问题,因为STARK的实际大小几乎与完整数据块相当。
长期路径包括:
A、实现理想的二维DAS;
B、继续使用一维DAS,接受较低的数据上限以换取简单性和稳健性;
C、放弃数据可用性,全面采用Plasma作为主要二层架构。
即使选择在L1上扩展执行,仍需考虑这些选项。若L1处理大量TPS,区块将非常大,客户端需要有效验证其正确性,因此必须在L1上使用与汇总相同的技术(ZK-EVM和DAS)。
4)与路线图其他部分的交互
如果实现了数据压缩(见下文)或Plasma被广泛使用,那么对二维DAS的需求可能会减少,或者至少会被推迟。此外,DAS对分布式区块构建的协议和机制也提出了挑战:尽管DAS在理论上适用于分布式重构,但在实际应用中,它需要与包含列表提案及其周围的分叉选择机制相结合。
3、数据压缩
1)我们要解决的问题
在以太坊汇总中,每笔ERC20转账大约占用180字节的数据空间,这限制了二层协议的可扩展性。以每个插槽16MB的数据为例,我们理论上可以实现约7407 TPS。如果能够减少每笔交易在链上占用的字节数,扩展性将大幅提升。
2)解决方案
通过多种数据压缩技术,我们可以减少每笔交易在链上的占用空间,具体方法包括:
A、零字节压缩:用两个字节表示长串零字节的数量。
B、签名聚合:用BLS签名替换ECDSA签名,多个签名可以合并为一个,有效降低验证成本。虽然在L1上不适用,但在L2环境中更有意义。
C、指针替换地址:将20字节的地址替换为4字节的历史指针,以节省空间,但需要将部分历史数据纳入状态。
D、自定义交易值序列化:使用自定义的小数浮点格式或字典化常见值,以紧凑方式表示交易值,比如将0.25 ETH表示为250,000,000,000,000,000 wei。
通过这些压缩技术,我们不仅能提高L2协议的扩展性,还能为整个以太坊网络带来更大的扩展潜力。结合数据可用性采样和分片扩展,我们有望实现数万 TPS 的吞吐量,确保以太坊能够支持去中心化应用并应对未来的增长需求。
3)尚待完成的工作及权衡
主要工作是实现这些压缩方案,关键权衡包括:
-
BLS签名的切换:需要大量努力,并可能降低与受信硬件的兼容性,可以考虑用ZK-SNARK封装来替代。
-
动态压缩的复杂性:用指针替换地址会增加客户端代码的复杂度。
-
降低可审计性:将状态差异而非交易发布到链上,会影响可审计性并使某些软件(如区块浏览器)无法正常工作。
4)与路线图其他部分的交互
ERC-4337的采用及其在L2 EVM中的固化将加速聚合技术的部署,同时在L1上固化部分ERC-4337功能也能促进其在L2上的应用。
4、通用 Plasma
1)我们要解决什么问题?
即使拥有16 MB的数据块和数据压缩,58,000 TPS也不足以满足消费支付、去中心化社交等高带宽行业的需求,尤其是考虑到隐私时,扩展性可能会降低3到8倍。目前,Validium作为一种链外数据存储方案,能在一定程度上保护用户资金,但运营者可能会消失,导致用户资金被冻结。我们可以找到更好的解决方案。
2)它是什么以及如何运作?
Plasma是一种扩展解决方案,运营者在链外发布区块,然后将这些区块的Merkle根上传到区块链上。每个用户会收到一个Merkle分支,这个分支可以用来证明他们的资产变动。用户只需提供这个分支就能提取资产,值得注意的是,这个分支不需要是基于最新的状态,即使数据不可用,用户也可以根据最新可用的状态来恢复他们的资产。如果用户提交了无效的分支,区块链上的挑战机制会决定资产的归属。
早期的Plasma版本主要用于支付,扩展性有限。但通过要求每个Merkle根经过SNARK验证,Plasma的功能得到了显著增强,挑战过程也变得更简单,能够支持更多种类的资产。在运营者不作弊的情况下,用户可以快速提取资金,而不必等待一周的挑战期。
Plasma系统并不需要完美。即使只能保护一部分资产(比如过去一周内未转移的Token),相对于当前的Validium等超可扩展EVM状态,已经取得了很大进步。
还有一种结构是混合Plasma和Rollups,比如Intmax。它在链上为每个用户仅存储少量数据(如5字节),结合了Plasma和Rollups的特性。在16 MB的环境下,理论上可以达到266,667 TPS,同时提供高可扩展性和隐私保护。
3)尚待完成的工作及权衡
主要的任务是将Plasma系统投入实际使用。值得注意的是,“Plasma与Validium”并非完全对立,Validium可以通过添加Plasma特性改善其安全性。研究重点是为EVM及其他应用构建优化功能,如信任需求、L1 gas成本和抵御拒绝服务攻击的能力。不过,Plasma的概念复杂性高于Rollup,需要更多研究来建立更好的通用框架。
使用Plasma设计的主要权衡在于其对运营商的依赖性更高,并且难以做到完全“基于信任”,但混合Plasma/Rollup设计通常可以避免这个问题。
4)与路线图中其他部分的交互
Plasma解决方案越有效,L1在高性能数据可用性方面的压力就越小。此外,将活动转移到L2也能减轻L1的MEV压力。
5、证明系统的成熟
1)我们在解决什么问题?
目前,大多数Rollup并未完全去信任化,仍存在安全委员会来监督证明系统的行为。在某些情况下,证明系统甚至没有激活,或仅是建议性的。领先的Rollup包括一些特定应用(如Fuel)以及Optimism和Arbitrum这两个全EVM的Rollup,它们已实现部分去信任化。然而,Rollup的发展受到对代码漏洞的担忧,因此需要寻求完全去信任化的解决方案。
2)它是什么以及如何运作?
首先,回顾“阶段”系统,简要总结如下:
-
阶段0:用户能够运行节点并同步链,验证可以是完全信任化。
-
阶段1:需要一个去信任化的证明系统,确保只有有效交易被接受。安全委员会可以覆盖证明系统,但需在75%投票阈值下,并至少有26%的成员不属于构建Rollup的主公司。升级机制需要长时间延迟,以便用户在恶意升级前可以退出资金。
-
阶段2:必须有一个去信任化的证明系统,确保只有有效交易被接受。安全委员会仅在证明系统出现漏洞时介入,升级机制需有非常长的延迟。
达到阶段2的主要挑战是建立对证明系统可靠性的信心,主要有两种方法:
A、形式化验证:使用现代数学和计算技术来证明证明系统只接受符合EVM规范的区块,技术上已经成熟,并且新进展使得这一方法更可行。
B、多重验证者:构建多个证明系统,并通过多签机制将资金放入这些系统之间。如果证明系统一致,安全委员会无权干预;如果不一致,委员会只能选择一个,而无法单方面决定。
多证明者的风格化示意图,结合了一种乐观证明系统、一种有效性证明系统和一个安全委员会。
3)尚待完成的工作及权衡
对于形式验证,我们需要完成许多任务,特别是要创建一个完整的SNARK证明器的形式验证版本。这项工作复杂,但我们已开始。一个简化的方法是先为一个最小的虚拟机(如RISC-V或Cairo)创建形式验证的SNARK证明器,然后在此虚拟机中实现EVM,并证明其与EVM规范的等效性。
对于多重验证者,还有两个主要任务。首先,我们需要对至少两个不同的证明系统建立信心,确保它们各自安全,并且故障原因不同,不会同时出现。其次,我们需要对合并证明系统的基本逻辑获得高度保障。虽然这可以通过一些方法来简化,例如将资金存储在一个代表各个证明系统的多签合同中,但这样会增加链上gas成本。因此,需要在效率和安全之间找到平衡。
4)与路线图中其他部分的交互
将活动转移到L2可以减少L1的MEV压力。
6、跨L2 互操作性改进
1)我们在解决什么问题?
目前,L2生态系统的一个主要问题是用户导航困难,且常见的导航方式(如集中式桥接和RPC客户端)会引入信任假设。为了让L2真正成为以太坊的一部分,我们需要让用户体验到一个统一的生态系统。
一个病态糟糕(甚至危险的)跨L2用户体验的例子——我个人在这里因链选择错误损失了100美元——尽管这并不是Polymarket的错,但跨L2的互操作性应由钱包和以太坊标准(ERC)社区负责。在一个正常运作的以太坊生态系统中,从L1向L2发送Token,或从一个L2向另一个L2发送Token,应该与在同一个L1内发送Token的体验相同。
2)跨L2互操作性改进
跨L2互操作性改进分为几个类别,主要目标是缩小现有L2生态系统与理想状态之间的差距,具体改进方向包括:
A、链特定地址:地址应包含链的信息,这样可以简化跨L2转账流程,钱包自动确定发送方式。
B、链特定支付请求:生成标准化的支付消息,便于个人支付和去中心化应用请求资金。
C、跨链交换和gas支付:创建开放协议表达跨链操作,支持不同L2之间的资产转移。
D、轻客户端:用户能够验证链的真实性,而不仅仅依赖RPC提供者,实现信任无关性。
这些改进将提高L2之间的互操作性,使用户跨链交互时的体验更加流畅和安全。
E、Keystore钱包:集中存储密钥,只需在一个地方更新即可,从多个L2读取。这需要L2具备标准化方法来无成本读取L1,相关提案包括:
A、L1SLOAD:在L2高效读取L1存储数据。
B、REMOTESTATICCALL:让L2以无成本调用L1函数读取信息。
通过Keystore钱包,用户可以更方便地管理跨链密钥更新。
F、共享Token桥构想:设想一个所有L2都是有效性证明rollup的世界,创建一个共享的最小化rollup,维护不同L2Token余额,允许跨L2批量转账。这能减少L1燃气费用,提高跨L2转账的效率。
G、同步可组合性:允许在特定L2与L1之间或多个L2之间进行同步调用,提升DeFi协议的金融效率。基于rollup的解决方案自然支持这些技术。
这些改进将提高L2之间的互操作性,使用户跨链交互时的体验更加流畅和安全。
3)剩下的工作及其权衡
许多示例面临标准化的时机和层级问题。过早标准化可能导致劣质方案的固化,而过晚则可能造成不必要的碎片化。在某些情况下,短期解决方案虽然简单但不理想,长期解决方案则更为完善但需时多年。
这些任务不仅是技术问题,还是社会问题,涉及L2、钱包和L1之间的合作。我们是否能成功解决这些问题,考验着社区的凝聚力。
4)与路线图其他部分的交互
大多数提案是较高层的构造,对L1的影响不大,唯一的例外是共享排序,它会对MEV产生显著影响。
7、扩展 L1 执行能力
1)要解决的问题
如果L2高度可扩展但L1交易量仍然低,可能给以太坊带来风险:
-
ETH资产的经济状况变得更脆弱,影响网络长期安全性。
-
L2依赖L1的金融生态系统,若生态系统减弱,L2的吸引力也会降低。
-
L2需要较长时间才能达到与L1相同的安全保障。
-
若某个L2失败,用户需通过L1恢复资产,因此L1必须能够处理复杂的L2清算。
因此,扩展L1并确保其能容纳更多应用场景非常重要。
2)这是什么,它是如何工作的?
简单增加gas上限是扩展L1的最直接方式,但这可能导致中心化,削弱以太坊的可信度。可持续性仍在讨论中,需考虑其他技术的实现来提高大区块的验证效率。
另一些扩展策略是识别能在不影响去中心化和安全性的情况下降低成本的特定功能。例如:
A、降低成本的特定计算:
-
EOF:新EVM字节码格式,便于静态分析,允许更快实现,并可降低gas成本。
-
多维燃气定价:为计算、数据和存储设置独立费用和限制,增加平均容量而不增加安全风险。
-
降低特定操作的燃气成本:例如,减少加法和其他简单操作的燃气费用,使其低于乘法。
B、EVM-MAX和SIMD:
-
EVM-MAX:允许更高效的本地大数字数学,通过模块隔离优化存储。
-
SIMD:在一组值上高效执行相同指令,有助于隐私协议和L2证明系统的扩展。
C、本地rollup(native rollups or "enshrined rollups"):创建多个并行运行的EVM副本,与rollup模型相等,但更原生地集成到协议中。
3)剩下的工作及其权衡
L1扩展有三种策略,可以单独或并行实施:
A、技术改进:优化客户端和历史数据处理,简化L1验证,随后提高油费限制。
B、降低特定操作成本:提升平均处理能力而不增加风险。
C、本地rollup创建多个EVM副本,给开发者灵活性。
这些技术各有优缺点。例如,本地rollup在组合性上有限,无法跨多个Rollup同步操作。提高gas限制可能减少验证节点和独立质押者的数量,而降低特定操作成本可能增加整体复杂性。
一个重要问题是:什么该放在L1上,什么该放在L2上?把所有内容都放在L1上不可行,因为潜在交易量巨大,会影响L1的验证能力(除非使用本地rollup)。因此,我们需要明确原则,以免提高油费限制损害以太坊L1的去中心化,最终大部分活动仍在L2上,L1失去其独特性。
关于L1和L2之间“分工”的一种提议观点
4)与路线图其他部分的交互
引入更多用户到L1意味着需要提升其规模和其他方面。这会导致更多的MEV留在L1,增加了对处理MEV的需求,也提升了L1快速时间槽的价值。同时,这也依赖于L1验证的顺利进行。
注:考虑到可读性,本文在原文基础上有做精简处理,详情请参见原文:https://vitalik.eth.limo/general/2024/10/17/futures2.html
本文链接:https://www.hellobtc.com/kp/du/10/5477.html
来源:https://vitalik.eth.limo/general/2024/10/17/futures2.html