解决客户端多样性问题的一个技术方案:小众客户端项目

2021-10-23 19:26:49 7579

截至发稿时,以太坊有多个客户端实现,但 Geth / go-ethereum 作为一个多数客户端脱颖而出,拥有 80%~90% 网络占有率。尽管这是对客户端稳定性及其开发者的褒奖,但这种情况会带来不良后果。

在以太坊1.0里,当一个单一的客户端在网络里占绝对的主导,其弊端是众所周知的:

  • 如果 Geth 在一个 DoS 攻击里崩溃了,依赖它的用户将无法进行交易或跟上权威链。

  • 如果 Geth 有一个共识故障,依赖它的用户将会看到不同版本的网络状态。

前一个问题有点糟糕,因为它会导致网络中断,但这是最糟糕的情况了。然而,后一个问题也特别糟糕,因为通过对网络的错误 (无效) 状态作出不可逆转的反应它会导致出现双花情况。高级用户 (如交易所) 通过同时运行多个客户端来解决上述问题,并在客户端间无法达成共识时发出警报 (例如禁止存款/提款)。

矿池也通常运行多个客户端,尽管对它们来说,在开发者搞清楚情况前在链分叉的两边都挖矿更有利,因为这可以避免它们因在历史上站错队而失去所有收入。无论怎样,区块链会继续延展下去,而无效的侧链最终不会成为权威链的一部分。一切如常进行。

在以太坊 2.0 里,一个新的潜在问题是出现以下两种情况:

  • 如果1/3 + 1 的网络验证者出现共识故障,网络就无法继续做最终敲定。

  • 如果 2/3 的网络验证者出现共识故障,无效链会被最终敲定。

有一些提议是将多数客户端的漏洞“写入”协议中,以避免重组最终敲定的结果,但这只是火上浇油。这不是激励验证者运行其他类型的客户端,而似乎是开发者为此惩罚他们,因为所有由有效但小众的客户端生成的区块都会变成孤块。这从本质上就锁定了 一个100%的单客户端网络。

另一个提议是要求人们运行一个小众的客户端,这一点一直被置若罔闻 (多年了),原因不过是当有一个在大多数情况下更好且可用的客户端时,为什么会有人想运行一个没那么稳定的客户端?维护基础设施是很耗时的,而且与照看可能不稳定的东西相比,人们有更好的事情要做。

似乎我们在这里有一个冲突:对于用户来说,运行 Geth 又好又简单,但可能会损害网络;而运行其他客户端可能没那么稳定且烦人,但可能会拯救网络。由于要求验证者运行一个小众客户端是不公平的 (并首当其冲地承担所有问题),这个项目旨在提出一个不一样的要求:还是要运行小众客户端,为你最喜欢的客户端充当哨兵。

共识协调

在深入 minority 项目是什么之前,有必要强调它不是什么。虽然我们表明的目标是让用户 (也) 运行小众客户端,这个项目不是关于实际设置和运行以太坊客户端的。有各种项目让家庭用户可以轻松运行一个或另一个客户端 (例如 DappNode),但一旦我们达到产品级的基础设施要求,它在很大程度上取决于个人使用情况、预算限制和开发运营能力,以提出关于运行什么、运行多少、在哪里和如何部署的“最佳”解决方案。

minority 项目假设验证者已经熟悉如何最好地部署到他们的基础设施;以及如何以合理稳定的方式提供和维护不同的独立客户端。其目标是成为共识层和执行层客户端之间的通信层,使得任何人都可以运行多个客户端 (多数的、小众的和组合),并且在接受一个状态变换 (无论是一个执行结果或要给共识更新) 之前达成一个 N/M 的共识。

例如:

  • minority 协调器可以确保只有在 2/3 的共识层客户端都对新链头达成共识时 (例如,Lighthouse 和 Lodestar 赞成,Teku 反对),执行层客户端的链头才会更新 。

  • minority 协调器可以确保只有在 2/3 的执行层客户端对新的状态根达成共识 (例如,Geth 和 Nethermind 赞成,OpenEthereum 反对) 时,执行数据才会被接受。

在共识层和执行层客户端间的高级通信层有一个额外的好处,就是能够对各种客户端统一收集和报告行为指标;并有可能在它们失控,导致网络中断之前检测到操作降级问题。通信中间件也允许统一收集两层之间事件的审计轨迹,有可能有助于调试客户端问题。

常见问题

Q: 运行一个执行客户端已经很昂贵了!要求验证者运行 2-3 个不是太过分了吗?

在撰写本文时,1 个 ETH= 3785 美元。运行一个验证者需要 32 个 ETH 的初始存款,相当于 12 万美元。在这个资金量级上,我们觉得并行运行 3 个执行层客户端以支持验证者是可以接受的安全投资。

Q: 运行一个额外的中间件意味着更多的工作!为什么共识层客户端不直接与多个执行层客户端通信?

共识层客户端和执行层客户端之间的多路复用解耦使得它们可以在任何时候被调换,而不会发生意外的行为变化。在任何一边重新实现多路复用器都会在最低程度带来轻微变化,最终可能需要拓扑重构来改变底层组件。

Q: 运行一个分布式多路复用器是显然的选项。中央协调器不是更简单吗?

中央服务器无疑更简单,但它也会形成单点故障,无论是因为硬件故障、软件错误还是机器过载。我们无法控制共识/执行层客户端生成的负载,所以在面对故障时,保持它们隔离似乎更安全。去中心化的架构也可能证明更容易横向扩展。

Q: 运行每个客户端都要带上多路复用器不是很奇怪吗?为什么不用一个编排集群?

每个客户端运行都带上一个额外的进程确实比简单地将它们指向一个编排集群需要更多的工作,但它可以减少复杂性,因为共识/执行层客户端仍然以1对1的形式运行。把集群理念带到任何一个客户端层,都要求这些客户端有效地处理1对N的连接问题,这是我们一开始就尽量避免的。

声明:所有在本站发表的文章,本站都具有最终编辑权。本站全部作品均系微算力原创或来自网络转载,转载目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责,所产生的纠纷与本站无关。如涉及作品内容、版权和其它问题,请尽快与本站联系。

相关推荐

  • 微信:aspcool
  • QQ:580076
  • 手机:18992859886
  • 工作时间:9:00~18:00(周一至周五)