霍鲁斯-一种不确定性下的无信任委托协议-计算机科学-自主AI代理-委托协议.pdfVIP

霍鲁斯-一种不确定性下的无信任委托协议-计算机科学-自主AI代理-委托协议.pdf

此“司法”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

霍鲁斯:一种不确定性下的无信任委托协议

DavidShiKevinJoo

OperatorLabsOperatorLabs

2025年7月1日

摘要

本正确性是系统的一种涌现属性,在这种系统中,暴露错误比犯错更便宜。在动态、

译低信任度的环境中,自主AI代理通过将工作委托给子代理受益,但不能通过预先规定

中或集中监督来确保正确性。我们提出了一种协议,该协议通过担保声明在递归验证游

3戏中强制执行正确性。任务以意图的形式发布,求解器竞争完成它们。选定的求解器

v在风险下执行任务,并由事后的验证者检查其正确性。任何挑战者都可以通过对其下

1

3注以触发验证过程来挑战结果。错误的代理将被削减,正确的反对者将获得奖励,并

6

0有一个惩罚错误的验证者自身的升级路径。当激励在求解器、挑战者和验证者中对齐

0

.时,伪造条件使正确性成为纳什均衡。

7

0

5

2

:1历史

v

i

x

r二十世纪对不确定性面前的协调问题的最佳回应来自弗里德里希·哈耶克,他认为价

a

格体系不仅是资源配置者,而且是分布式信息处理器[1]。对于哈耶克而言,价格机制是一

种计算解决方案的方法,这种方案中央计划者不可能解决。然而,价格信号的力量受制于

所售商品,并且随着经济活动从实物商品转向服务和知识,市场可靠定价无形工作的局限

性变得越来越明显。

哈特和莫尔用不完全合同理论形式化了这些限制条件~[2]。在任何不确定性普遍存在

且变量无法被观察或控制的系统中,合同被迫具有根本性的开放性。哈德菲尔德和哈德菲

尔德-梅内尔扩展了不完全合同理论,认为人工智能对齐与人类缔约一样,依赖于AI解释

并响应规范结构的能力~[3]。如何使这种规范敏感性成为实际行动的问题仍未解决。

机构补救措施的局限性并未标志着在对抗环境中实现可扩展和公正裁决的努力的终

结。到了二十世纪末,机制设计领域作为理解规则和激励如何塑造经济系统中战略行为的

形式框架而出现。Hurwicz、Maskin和Myerson将协调视为一个工程问题,认为通过精心

构建激励,可以使利己的参与者揭示私人信息、诚实地报告并实现集体验证[4,?,6]。

1

比特币的出现带来了实际应用上的革命。中本聪展示了在广泛的、匿名的网络上实现

共识和结算事实的可能性,而无需可信的中介机构[7]。VitalikButerin扩展了这一突破,

不仅实现了价值转移,还通过智能合约的形式执行任意图灵完备逻辑[8]。这种方式使数

字货币、证券以及其他数字资产成为可能,只要交易逻辑能够在协议内表达和验证即可。

UMA[9]和Polymarket[10]进一步扩展了这些理念,通过纳入主观裁决机制解决了参与者

以经济共识解决模糊性的问题。

所有这些机制都依赖于相同的底层结构:如果暴露错误比犯错更便宜,真相就成为稳

定的结果。正如卡尔·波普尔所观察到的,在复杂领域中,知识并不取决于详尽的规定,而

是取决于系统地接受证伪[11]。UMA实例化了这一原则用于有限制的说法,其中可能的

结果空间是离散的。然而,随着任务变得更加模糊且具有时间延续性,这种模型达到了其

极限。Horus在此基础上将对抗验证推广到任意任务。它不需要事前清晰或二元结果,而

是使正确性能够通过对抗方式浮现出来,解决了在高级学习系统中识别的规范失败模式和

欺骗性对齐问题[12]。

2协议

何露斯通过使错误在经济上无利可图来维护正确性。该协议由一个伪造条件管理:

文档评论(0)

zikele + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档