作者:王超
「Autonomous」- 中文译为「自主」,也常被翻译为「自治」。这是在我过去几年的学习和工作中非常重要的一个词。它是 DAO 里的「A」,也是自主世界概念里的「A」,还代表了人们对人工智能的期望 - 自主智能体( Autonomous Agent )。
作为新方向,大家自然对 Autonomous 的理解有很大的差异。到底什么是 Autonomous ?不同领域的 Autonomous 含义是否一样?绝对意义的 Autonomous 是否存在?
今天斗胆来拆解一下这个词的前世今生。
Autonomous - 由「Auto」和「Normos」两个希腊语单词组合演化而成。「Auto」在希腊语里指「自我」,而「Normos」则来自于拉丁语中的「Norma」,一种木匠用的九十度直尺。
Norma - 木匠用的九十度直尺这个词随后被延伸成为「法律 / 习俗」的概念,英文中的「Norm」( 规范 ) 即来自于此。
在古希腊的原始含义中「Autonomous」指的是有权自治、制定自己的法律且不受更大管理机构控制。
古希腊并不是像现代国家那样的统一国家,它由众多城邦(polis)组成,每个城邦都是一个独立的政治实体,拥有自己的治理结构、法律和习俗。不同的城邦有不同的政府形式,例如雅典是民主制,而斯巴达是寡头制和君主制混合体,而他们彼此之间经常存在竞争或冲突。自治这个词源于此时,反映了这些城邦及其公民在分散且竞争的环境中保持其独特身份、治理结构和生活方式的愿望。
随着时间的推移,自主的概念开始应用于个人,指个人自主按照自己的原则或信仰行事的能力。被加密圈视为经典的《主权个人》一书曾就经济自主、技术赋权等角度深入探讨了个人自主性这一话题。
当科技继续进步,「自主」一词开始有了新的含义 – 「无需人工直接干预或外部控制即可运行的机器或系统」。如今,「自主」通常与技术联系在一起,比如无人驾驶会被成为「autonomous driving sytem」。这些系统「自主」运行,它们不需要持续的人工监督来运行。这种现代解释仍然带有「自我治理」的核心思想,但其背景已远远超出了古希腊人的想象。
「自主」这个词的含义变化展现了文化、技术和社会是如何塑造并改变大众的认知。
AI 中的自主在人工智能领域「自主」一词通常指无需人工干预即可执行任务的系统。
以订餐场景来说, ChatGPT 这样的 ChatBot 能够给用户提供从卡路里计算,到菜品和餐厅推荐等很多参考信息,但它无法完成订餐。
而 Agent 则可以按照用户的指令去完成订餐,比如「在美团上预定今晚国贸蓝蛙餐厅的两个餐位」。不过 Agent 要完成这一工作有个前提 - 已经预先设计好了订餐的工作流程并接入了美团的服务。如果程序员没给这 Agent 写好如何订餐,怎么接入美团, Agent 面对这一指令无能为力。
Autonomous Agent (自主智能体)相较普通 Agent 增加了自主性,体现在更强大的思考能力和更加通用的行动能力。当用户说「晚上在国贸附近定两个安静一点的餐位」,自主智能体会理解用户的意图,思考如何行动并执行。程序员并不需要预先教 Agent 如何订餐,或是如何订机票,如何在 ebay 上买东西,它会在通用工作框架之下,根据自己对这个世界的理解和线上的通用交互规则进行行动,完成任务,是为自主。
从某种程度上说,我们在科幻电影里看到的所有机器人都是自主智能体。关于自主智能体的更多场景和思考可以参考「从 J.A.R.V.I.S.到西部世界 – 智能体和人类共生的未来」这篇文章。
尽管 Autonomous 的含义在 AI 圈没有太大的分歧,但大家对于自主智能体的期望程度还是有很大的区别。自动驾驶领域里有一个分级体系,从 L0 的完全人工驾驶到 L5 的完全自动驾驶。这一分级体系对自主智能体也有很强的参考性。
微软的自主智能体采用总监(微软竟然有这么个职位)曾表示 Autonomous 就是类似人类的行动和决策(human-like action and decision-making)。微软最终把采用的重点放在让自主智能体解决企业现有工作流程中的某一个环节上,从技术采用的角度,这是个很现实的选择。不过这样的自主程度从分级上充其量也就是 L2 或者 L2.5。
自主智能体方向的创业团队们则有更大的野心,他们希望能够在很多场景里完全替代人,比如 AI 销售代表。从对应的分级来说,这起码到了 L3 和 L4 这个范围。
一个提供 AI 销售代表服务的创业项目作为看热闹不嫌事大的观察者,我对智能体的自主程度有更大的期待。
设想一下,未来我的日常工作和生活都依赖自主智能体的帮助,一天早晨我呼叫自主智能体突然发现没反应。检查发现原来是托管的亚马逊云服务出了故障。任它如此能干,一拔网线就挂了,这不能忍。一个具备更高自主性的智能体不仅应具备思考和决策的能力,还应具备在无需人工干预的情况下长期稳定运行的能力,无法轻易被拔网线将是自主智能体的基本需求。而它们作为有着更强行为能力的主体,理应还应有数字身份,一定程度的自主财务,甚至是自我的算力控制和能源管理。
在我看来这将是加密和 AI 的天然结合点之一。如果这个世界上有一个地方能提供安全可靠的运行环境,提供独立且便于操作的财务体系而不是依靠某个机构来批准并随时可以关闭的银行账号,而这个世界中的大部分应用都提供无许可的接入并具备便捷的可操作性。自主智能体没有理由不选择这样的环境栖息。换句话说,加密网络未来定是 AI 实现高层级自主性的基础设施。
DAO 中的自主相比 AI,大家对 DAO 里 Autonomous 的理解则存在着较大的分歧。
DAO 的理念早于区块链系统的诞生,但第一次把 DAO 作为一个正式的概念提出并在文档中进行明确的定义是在初版以太坊白皮书。Vitalik 在白皮书里把去中心化组织归类为两种,DO(去中心化组织)和 DAO (去中心化自主组织)。其中 Autonomous 是指组织完全依赖部署在智能合约里的代码,实现持续的、不被外界干涉的自主运行。
The difference between a DO and a DAO is fuzzy,but the general dividing line is whether the governance is generally carriedout via a political-like process or an “automatic” process。
DO 和 DAO 的界限有时候是模糊的,但有一个通用的分界线可以参考 – 治理是通过类似政治的协商过程完成 (DO),还是「自动化」的过程 (DAO)。
以太坊白皮书 2014.12 版本
然而这个世界是复杂的。加密技术带来了更加高效公平的所有权分发,带来更强的协调能力,各种拥有不同文化和兴趣的社区开始利用这些技术进行组织并共同行动。尽管加密领域的参与者普遍有着对「code is law」理念的认同,但江湖太过复杂,能在智能合约里跑的业务逻辑才有多少?指望用一套智能合约代码就搞定了一个组织的全部工作并能持续自动化运转,这在很长一段时间内都是不可能做到的事情。
如果按初版以太坊白皮书的定义,现如今所有的 DAO 都不算 DAO 。
世界在不断演化, Autonomous 一词在现实世界里经历了从自我治理到自动化运行 ( 治理 ) 的转变,到了加密世界则经历了一次逆向的蜕变。
从现实出发,有很多 DAO 的运营者不再坚持追求完全的基于代码的全自主运行,而是把更多的空间给到了 social layer , Autonomous 的含义也就从自动化治理又回到了组织的自主治理。也可能是觉得这样的非自动化 DAO 才是当今技术所能支持的主流,以太坊白皮书也在后续的一次更新中删除了 DO 的概念,从而进一步模糊了 DAO 里的 Autonomous 的定义。而随着近两年 network state 概念的流行, DAO 中的 Autonomous 也愈发接近它在古希腊诞生之时含义。
如果要我说,其实这个 Autonomous 如何理解以及如何实践都并不那么重要。原初对 DAO 的定义代表着一种理想,一种技术赋权的期望,尽管当前还做不到,但这是一种美好而纯粹的追求。
而现在已经诞生出来的成百上千个 DAO ,大家牺牲了技术层的强壮性,用文化层进行弥补,让拥有共同价值观的社区成员有机的结合在一起,通过区块链技术进行更加强大的协调、激励以及所有权的分发,进而创造出了很多原本这世界不存在的模式和成就,这同样是时代之幸。
我过去的观点认为随着加密技术的发展以及基础设施的完善, DAO 会逐渐减少对人的依赖。可能今天我们还在用 gnosis 的手动多签方式管理社区财库,明天可能就打通了提案系统和财库系统实现分配资金的自动化。后天可能就把DAO 里的角色通过一种方式放到链上,实现关键角色权限分配的自动化。自动化体系一点一点蚕食人的角色,最终在某一个时间点,DAO 由依赖人运行变成完全依赖代码运行。
但随着对更多项目的观察以及不同 DAO 在几年内的发展变化,我开始觉得现如今的社区 DAO 和理想中自动化运行的 DAO 应该是不同的物种,他们未来会走出完全不同的道路,而不是在某一个时间点合二为一。
以人为主的 DAO 确实存在大量空间可以提升自动化程度以改善效率、协调和增加信任,但它的价值创造主体始终是社区,是社区里的每一个不同的个体。人,始终是重要的。
而畅想中完全依赖代码运行的 DAO ,它的起点则可能是一些别的东西,比如 – 自主世界。
自主世界中的自主自主世界 - 「Autonomous World」,也常被简写为 「AW」。这个概念由 0xPARC 在 2022 年首次提出,经过一年的发酵,开始被越来越多的讨论。自主世界是个相对复杂的概念,很多人把它视作全链游戏方向的一个概念,但我不这么认为。这是一个技术、文化、政治和哲学等多个领域的交叉地带。
在 Autonomous World 的概念中,世界并不是特指人类生活的地方,而是一个容器,一个容纳规则、叙事的地方。人类生存的世界当然是个世界,但《三体》也是个世界,存在于书本、B 站、腾讯视频和人们的脑海中。《仙剑奇侠传》《指环王》同样都是世界。世界也未必一定跟故事相关,例如化学也可以认为是一个世界。它同样提供了空间和自己的规则。
这说起来也并不是一个新概念,Reddit 里有一个 worldbuilding 子版块,我喜欢隔三岔五就去看看大家在聊啥,里面有很多人乐此不疲的去构想一个世界的地理、气候、历史、传说、文化、社会、技术、生物链等背景等等。
一个被构建的世界有人甚至在自己构建的世界里详细设计了大洲之间的洋流还有人为自己构想的世界设计了一套暗黑元素周期表截图翻译:我是一个完美主义者,同时也是一个世界构建者,这意味着我将我的世界打造得无可挑剔,不让任何怀疑溜进去。在我的世界里,我有 2000 年未完成的历史,包括战争、世仇、一些关于某些国家如何衰落的详细事件、某个帝国的君主名单、地区探索等。从一个时间框架和你喜欢的东西开始,然后扩展它来创造你的历史。我在这方面已经搞了几年,但只完成了大约 300 年的历史。简单梳理了世界的概念后,再来看自主世界是什么。在定义上,0xPARC 认为自主世界是具有「区块链底层的世界」。更具体的说 -
Autonomous Worlds have hard diegetic boundaries, formalised introduction rules, and no need for privileged individuals to keep the World alive.
自主世界有着严格的叙事边界、正式化的引入规则,它不需要特权个体来维持其生存。Ludens from 0xPARC
定义中描述了「自主世界」的三个核心特点:
严格 (Hard) 的叙事边界: 这意味着这个世界有一套固定和不可变的基准规则。它们不会随时间或情况而改变,为世界提供了一种稳定性。正式化的引入规则: 这表明进入和参与这个世界有一套明确和固定规则。这些规则包括如何成为这个世界的一部分,以及如何在其中进行互动。不需要特权个体来维持其存在: 这意味着这个世界是自我维持的,不依赖于任何特定的个体或组织来维护或管理。从这个角度讲,Autonomous World 反而更接近原初定义的 DAO - 在预设规则下自主运行,不依赖某个个体,也不依赖软性的规则或类似政治的协调过程。或者说 DAO 本身就是自主世界的一种形态。
这样一个自主世界的魅力何在?我认为是客观性。
我们生活的现实世界是客观的,没有人拥有这个世界,这个世界也并不因为某个人,某个组织而存在。维持这个世界存在并运行的基础法则是物理定律,每个人都可以在同一物理定律下,对这个世界施加影响,并让这个影响成为这个世界的客观事实。
但《哈利波特》的世界不是客观的,如果 J.K.罗琳写的时候多加了一个人物进去,这个人物就变成了世界的一部分,如果她没写,那就没有。这个世界由 J.K.罗琳构建,也依赖 J.K.罗琳而维系其规则,千千万万的爱好者可以读它,爱它,但无法改变它,无法去九又四分之三站台留下一个背包。
《魔兽世界》也不是客观的,尽管人们可以在暴雪公司设定好的规则下进入这个世界互动生活,并影响这个世界里的「客观事实」。但《魔兽世界》本质上依赖于暴雪公司及其管理者的主观意志而存在。当去年网易和暴雪合作破裂,中国区玩家所创造的一切客观也就随之湮灭。
但现在,我们有机会创造出一个基于区块链网络的,自主的、客观的世界。在这样一个个具体的自主世界中,人们的一切创造就成为了客观事实,一个具备稳定规则并自我维持的世界中的客观事实。
以上概述了 Autonomous 的概念几个不同领域里的含义及其背后逻辑。仅是我个人的思考,不一定都对。而 Autonomous 的含义也还在持续演化。「自主」是人类文明中最为深刻的议题之一,远超此文短短几千字所能涵盖。
过去的一周我啃了一本科幻小说《盲视》,这是一本被各大出版社拒绝后不得不免费刊发在网上的书。它被很多人视为神作,也被很多人视为垃圾。作者的另一个身份是海洋生物学家,偏学术的表达和不算流畅的文笔让阅读体验并不愉快,支撑我把它读完的是小说中提出的一个观点 - 有没有可能人类引以为傲的自我意识反而是限制人类发展的枷锁?作者在这里的思考充满着睿智,引人深思。
从这个思考再跳到另一个争论已久的话题 - 人是自主的吗?会不会世界上发生的一切早已被更高维度的代码所定义。
我们在这世间追求自主,但是否真能跳出宇宙智能合约的束缚?