轉發原文標題:《d/acc:一年後》
大約一年前,我寫了一篇關於技術樂觀主義的文章,表達了我對技術的熱情以及它可能帶來的巨大好處,同時也對一些特定問題表示謹慎,主要集中在超智能人工智能上,以及如果技術構建不當可能導致的毀滅或人類的不可逆轉失能。文章中的一個核心思想是:去中心化和民主的差異化防禦加速。我們應該加速技術發展,但要重點關注那些增強我們防禦能力的技術,而不是造成傷害的技術,同時要確保權力的分散,而不是集中在某個精英手中。我們的防禦方式應像民主的瑞士和歷史上的準無政府狀態地區,而不是中世紀封建制度下的領主與城堡。
在過去的一年中,這一哲學和理念得到了顯著的發展。我在“80,000 小時”節目中討論了這些想法,並收到了許多反響,大多數是積極的,也有一些批評。我們的工作仍在繼續,並取得了一些成果:我們在可驗證的開源疫苗方面取得了進展,健康室內空氣的價值得到越來越多的認可,社區筆記繼續發揮作用,預測市場作為信息工具迎來了突破性的一年,零知識證明(ZK-SNARKs)在政府身份識別和社交媒體中得到了應用(並通過帳戶抽象 保護以太坊錢包),還有在醫學和腦機接口(BCI)中應用的開源成像工具等。去年秋天,我們舉行了第一次重要的d/acc活動:“d/acc發現日”(d/aDDy),在Devcon上進行了,活動中有來自d/acc各個領域(生物、物理、網絡、信息防禦和神經技術)的演講者。多年來從事這些技術研究的人們越來越意識到彼此的工作,而外部人士也越來越關注更大的背景:推動以太坊和加密貨幣的相同價值觀可以應用於更廣泛的世界。
現在是2042年。你在媒體上看到關於你所在城市可能出現新疫情的報道。你對此已經習慣:人們對每種動物疾病的突變總是過於興奮,而大多數情況最終並沒有發展成真正的疫情。之前的兩個潛在疫情通過廢水監測和社交媒體的開源分析被非常早地發現並完全遏制。但這一次,預測市場顯示至少有10,000例的概率為60%,因此你開始感到擔憂。
病毒的基因序列昨天被確認。你的便攜式空氣測試儀的軟件更新已經可以檢測新病毒(通過一次呼吸或在一個房間內暴露15分鐘的室內空氣)。使用任何現代醫療設施中可以找到的設備生成疫苗的開源說明和代碼預計在幾周內可用。目前大多數人尚未採取行動,主要依賴於普遍使用的空氣過濾和通風來保護自己。由於你有免疫系統疾病,所以更加謹慎:你的開源本地運行的個人助手AI,除了處理導航、餐廳和活動推薦外,還實時考慮空氣測試儀和二氧化碳數據,只推薦最安全的場所。這些數據由成千上萬的參與者和設備提供,利用零知識證明(ZK-SNARK)和差別隱私技術,最大程度降低數據洩露或被濫用的風險(如果你想為這些數據集貢獻數據,還有其他個人助手AI來驗證這些加密工具的有效性)。
兩個月後,疫情消失了:似乎60%的人遵循基本的防護措施,即當空氣測試儀發出警報並顯示病毒存在時戴上口罩,個人檢測陽性時待在家中,這足以將已經因重度空氣過濾而顯著降低的傳播率壓低到1以下。模擬顯示,二十年前可能比Covid嚴重五倍的疾病,如今卻成了無關緊要的問題。
![]() | ![]() |
Devcon d/acc 日
Devcon上的d/acc活動最積極的收穫之一是,d/acc的框架成功地將來自不同領域的人聚集在一起,使他們對彼此的工作產生了真正的興趣。
創建具有“多樣性”的活動很簡單,但讓不同背景和興趣的人真正相互聯繫卻很困難。我仍然記得在中學和高中時被迫觀看長時間的歌劇,而我個人覺得它們很無聊。我知道我“應該”欣賞它們,因為如果不這樣,我就會被認為是沒有文化的計算機科學粗人,但我並沒有在更真實的層面上與內容產生共鳴。d/acc日完全沒有這種感覺:人們似乎真的享受了解不同領域的不同工作。
如果我們想創造一個比統治、減速和毀滅更光明的替代方案,我們需要這種廣泛的聯盟建設。d/acc似乎確實在這方面取得了成功,這本身就顯示了這個理念的價值。
d/acc的核心思想很簡單:去中心化和民主的差異化防禦加速。
我們需要構建一些技術,使攻防平衡向防禦傾斜,並且不依賴於將更多權力交給集中權威。這兩者之間有著內在的聯繫:任何形式的去中心化、民主或自由的政治結構在防禦容易時發展最好,而在防禦困難時面臨最大的挑戰——在這種情況下,結果更可能是所有人相互對抗的戰爭,最終形成強者統治的局面。
d/acc的核心原則適用於多個領域:
圖表來自 My Techno-Optimis,
從我去年關於技術樂觀主義的文章中可以看出,理解同時追求去中心化、防禦性和加速思維的重要性的一種方法是將其與放棄這三者的哲學進行對比。
這種策略的挑戰有兩個方面。首先,從整體上看,技術和經濟增長對人類是極其有利的,任何延遲都會帶來難以估量的成本。其次,在一個非極權的世界中,不進步是不穩定的:誰“作弊”得最多,找到可信的方式繼續進步,誰就會領先。減速主義策略在某些背景下可以在一定程度上發揮作用:例如,歐洲食品比美國食品更健康就是一個例子,核不擴散至今的成功也是另一個。但它們不能永遠有效。
對於 d/acc,我們希望:
另一種理解d/acc的方法是回到2000年代末歐洲海盜黨運動的一個框架:賦權。
目標是構建一個保留人類自主權的世界,既實現避免他人(無論是作為私人公民的其他人,還是政府,或超智能機器人)主動干預的消極自由,又實現我們塑造自己命運的能力,以及確保我們擁有知識和資源的積極自由。這與幾個世紀以來的古典自由主義傳統相呼應,其中也包括斯圖爾特·布蘭德對“工具獲取”的關注,以及約翰·斯圖爾特·密爾將教育與自由視為人類進步的關鍵組成部分——或許,人們還可以補充,巴克敏斯特·富勒希望看到全球解決過程是參與性和廣泛分佈的。我們可以將d/acc視為在21世紀的技術背景下實現這些相同目標的一種方式。
在我去年的文章中,d/acc特別關注防禦性技術:物理防禦、生物防禦、網絡防禦和信息防禦。然而,去中心化的防禦不足以使世界變得偉大:你還需要一個前瞻性的積極願景,來說明人類如何利用其新獲得的去中心化和安全性來實現目標。
去年的文章確實包含了一個積極的願景,在兩個地方:
但這兩個觀點與d/acc的論點似乎沒有聯繫:“這裡有一些在基礎層面創造更民主和更有防禦性的世界的想法,順便提一下,這裡還有一些與超智能無關的想法。”
然而,我認為實際上,“防禦性”和“進步性”d/acc技術之間有一些非常重要的聯繫。讓我們通過增加這個軸(同時將其重新標記為“生存與發展”)來擴展去年的d/acc圖表,看看會有什麼結果:
在所有領域中,有一種一致的模式,即可以幫助我們在一個領域“生存”的科學、思想和工具與可以幫助我們“繁榮”的科學、思想和工具密切相關。一些例子:
此外,不同學科之間還存在重要的相互依賴關係:
不同的人對人工智能的時間線有很大差異。
這張圖來自2023年的黑山Zuzalu。
我去年文章中最有說服力的反對意見來自人工智能安全社區。論點是:“當然,如果我們還有半個世紀才能擁有強人工智能,我們可以集中精力構建所有這些好的東西。但實際上,看起來我們只有三年的時間線才能實現通用人工智能(AGI),再過三年才能實現超智能。因此,如果我們不想讓世界被毀滅或陷入不可逆轉的陷阱,我們不僅要加速好的事物,還必須減緩壞的事物,這意味著必須通過強有力的監管,這可能會讓有權勢的人感到不滿。”在我去年的文章中,我確實沒有呼籲任何具體的“減緩壞事物”的策略,除了對不構建風險形式的超智能的模糊呼籲。因此,在這裡,值得直接回答這個問題:如果我們生活在一個 最不方便的世界,人工智能風險高,時間線可能只有五年,我會支持什麼樣的監管?
去年,主要提出的人工智能監管是加利福尼亞州 SB-1047 法案。SB-1047要求最強大的模型的開發者(那些訓練成本超過1億美元,或微調超過1000萬美元的模型)在發佈之前採取一些安全測試措施。此外,如果他們未能盡到足夠的注意義務,法案還對人工智能模型的開發者施加責任。許多反對者認為該法案“威脅到開源”;我不同意,因為成本門檻意味著它隻影響最強大的模型:甚至LLama3可能都低於這個門檻。然而,回顧起來,我認為法案存在更大的問題:與大多數監管一樣,它過於適應當前的情況。對訓練成本的關注在面對新技術時顯得脆弱:最近的最先進的Deepseek v3模型的訓練成本僅600萬美元,而在新模型如o1中,成本正在更普遍地從訓練轉向推理。
其次,實際上負責人工智能超智能災難場景的最可能的參與者是軍方。
正如我們在去半個世紀的生物安全(及其他領域)中所見,軍方願意做一些可怕的事情,他們也容易犯錯誤。今天,人工智能在軍事上的應用正在迅速推進(參見烏克蘭、加沙)。而政府通過的任何安全監管,默認情況下都會使他們自己的軍隊和與軍隊緊密合作的公司免責。
儘管如此,這些論點並不是讓我們束手無策的理由。相反,我們可以將它們作為指南,嘗試制定儘量減少這些擔憂的規則。
如果某人以某種方式造成了法律上可追究的損害,他們可能會被起訴。這並不能解決來自軍方和其他“超越法律”行為者的風險問題,但這是一個非常通用的做法,避免了過度適應,並且通常得到傾向自由主義的經濟學家的支持,正是出於這個原因。
迄今為止已考慮的主要責任目標是:
將責任歸於用戶似乎是最符合激勵的。雖然模型的開發方式與最終使用方式之間的聯繫常常不清楚,但用戶確切決定了人工智能的使用方式。對用戶施加責任會產生強大的壓力,促使他們以我認為正確的方式使用人工智能:專注於為人類思維構建機械外骨骼,而不是創造新的自給自足的智能生命形式。前者會定期響應用戶意圖,因此不會導致災難性行為,除非用戶希望這樣。後者則有最大的風險,可能導致經典的“人工智能失控”場景。將責任儘可能接近最終使用的另一個好處是,它最大限度地減少了責任導致人們採取其他有害行動的風險(例如,閉源、KYC和監控、國家與企業勾結祕密限制用戶,例如取消銀行賬戶、鎖定世界大片區域)。
對僅將責任歸於用戶有一個經典的反對論點:用戶可能是沒有太多錢的普通個人,甚至是匿名的,沒有人能實際賠償災難性損害。這個論點可能被誇大:即使某些用戶太小而無法承擔責任,人工智能開發者的平均客戶並非如此,因此人工智能開發者仍然會有動力構建能夠讓用戶確信不會面臨高責任風險的產品。儘管如此,這仍然是一個有效的論點,需要得到解決。你需要激勵管道中的某個人,他們有資源採取適當的注意義務,而部署者和開發者都是容易的目標,他們仍然對模型的安全性或不安全性有很大的影響。
對部署者施加責任似乎是合理的。一個常被提到的擔憂是,這對開源模型可能不起作用,但這似乎是可以管理的,尤其是因為最強大的模型很可能無論如何都是閉源的(如果它們最終是開源的,那麼儘管部署者責任並沒有太大用處,但也不會造成太大傷害)。開發者責任也存在同樣的擔憂(儘管對於開源模型來說,需要微調模型以使其執行一些原本不允許的操作會有一些障礙),但同樣的反駁適用。作為一般原則,對控制施加“稅”,並基本上說“你可以構建你無法控制的東西,或者你可以構建你控制的東西,但如果你構建你控制的東西,那麼20%的控制必須用於我們的目的”,似乎是法律系統可以採取的合理立場。
一個似乎尚未得到充分探討的想法是將責任歸咎於管道中的其他參與者,這些參與者更能保證擁有充足的資源。一個對 d/acc 非常友好的想法是 讓人工智能接管的任何設備的所有者或操作員承擔責任 (例如通過黑客攻擊)在執行一些災難性有害操作的過程中。這將產生非常廣泛的激勵,促使人們努力工作,使世界(尤其是計算和生物)基礎設施儘可能安全。
如果我確信我們 需要 比責任規則更“強有力”的東西,這就是我想要的。目標是能夠在關鍵時期將全球可用計算量減少約 90-99%,持續 1-2 年,為人類爭取更多時間做好準備。 1-2年的價值不應被誇大:一年的“戰時模式”很容易抵得上在自滿的情況下工作一百年。實施方法“暫停“已經進行了探討,包括具體建議,例如 需要註冊 和 驗證位置 硬件。
更先進的方法是使用巧妙的加密技巧:例如,生產的工業規模(但不是消費級)人工智能硬件可以配備可信硬件芯片,只有在一次獲得 3/3 簽名的情況下才允許其繼續運行一週來自主要國際機構,包括至少一個非軍事附屬機構。簽名將是獨立於設備的(如果需要,我們甚至可以要求零知識證明它們是在區塊鏈上發佈的),因此這將是全有或全無:沒有實用的方法來授權一臺設備繼續運行而不授權所有其他設備。
這感覺就像它在利益最大化和風險最小化方面“勾選了複選框”:
硬件監管已經得到強烈考慮,儘管通常是通過 出口管制,其固有的理念是“我們信任自己的一方,但不信任對方”。利奧波德·阿申布倫納 (Leopold Aschenbrenner) 曾主張美國應該 爭奪決定性優勢 進而 本質上是在迫使中國 簽署一份 協議 限制多少 盒子 他們被允許奔跑。對我來說,這種方法似乎有風險,並且可能會結合以下缺陷: 多極種族 和集中化。如果我們必須限制人,那麼似乎更好的是在平等的基礎上限制每個人,並努力實際嘗試合作來組織這一點,而不是一個政黨試圖主宰其他所有人。
這兩種策略(責任和硬件暫停按鈕)都有不足之處,顯然它們只是臨時的解決方案:如果在某個時間點T時某項技術可以在超級計算機上實現,那麼在T+5年時,它很可能也能在普通筆記本電腦上實現。因此,我們需要更穩定的解決方案來爭取時間。許多d/acc技術在這方面是相關的。我們可以從以下幾個方面來看待d/acc技術的作用:如果人工智能接管了世界,它將如何做到這一點?
正如上面簡要提到的, 責任規則自然是一種對 d/acc 友好的監管方式,因為它們可以非常有效地激勵世界各地採用這些防禦措施並認真對待它們。臺灣 一直在嘗試 最近的虛假廣告責任,可以被視為利用責任鼓勵信息防禦的一個例子。我們不應該 也 熱衷於將責任無處不在,並記住普通自由的好處,使小人物能夠參與創新而不必擔心訴訟,但是當我們確實希望更有力地推動安全時,責任可以相當靈活和有效。
d/acc 的大部分內容遠遠超出了典型的區塊鏈主題:生物安全、BCI 和協作討論工具似乎與加密貨幣人士通常談論的事情相去甚遠。然而,我認為加密貨幣和 d/acc 之間存在一些重要的聯繫,特別是:
Cursive是一款應用,通過完全同態加密(FHE)允許用戶識別與其他用戶的共同興趣領域,同時保護隱私。這款應用在Zuzalu的眾多分支之一Edge City中使用,地點在清邁。
除了這些直接交叉點之外,還有另一個重要的共同興趣點: 籌資機制。
我一直感興趣的是尋找更好的機制來資助公共產品:對非常大群體有價值的項目,但沒有自然可行的商業模式。我過去在這方面的工作包括我對二次融資及其在Gitcoin Grants中的應用、復古公共產品融資(PGF),以及最近的深度融資的貢獻。
許多人對公共物品這個概念持懷疑態度。懷疑論通常有兩個來源:
這些都是重要的批評,也是好的批評。然而,我認為強大的去中心化公共產品資金對於 d/acc 願景至關重要,因為關鍵的 d/acc 目標(最小化中心控制點)本質上會挫敗許多傳統的商業模式。在開源基礎上建立成功的企業是可能的 - 一些 獎項 受贈者 正在這樣做 - 但在某些情況下,重要項目需要額外的持續支持已經夠困難的了。因此, 我們必須做困難的事情,並找出如何以解決上述批評的方式進行公共物品資助。
第一個問題的解決方案基本上是 可信的中立性 和 @VitalikButerin/the-meaning-of-decentralization-a0c92b76a274”>權力下放。中央計劃是有問題的,因為它把控制權交給了可能會濫用權力的精英,而且因為它經常 過度適應目前的情況 並且隨著時間的推移變得越來越無效。二次方融資和類似機制正是以一種儘可能可信的中立和(結構上和政治上)去中心化的方式為公共產品提供資金。
第二個問題更具挑戰性。對於二次方融資,一個常見的批評是它 很快就變成了一場人氣競賽,要求項目資助者花費大量精力公開宣傳。此外,“在人們眼前”的項目(例如最終用戶應用程序)會獲得資助,但更多的是在後臺的項目(原型“內布拉斯加州一個人維持的依賴”)根本得不到任何資金。樂觀復古資金依賴於較少數量的專家徽章持有者;在這裡,人氣競賽的影響被削弱,但與徽章持有者建立密切個人聯繫的社會影響被放大。
深度融資 是我自己為解決這個問題所做的最新努力。深度融資有兩個主要創新點:
但深度融資只是最新的例子。之前已經有過其他公共產品融資機制的想法,未來還會有更多。 同種異體專家 對它們進行很好的編目。 根本目標是創建一個社會工具,能夠以一定程度的準確性、公平性和開放性為公共產品提供資金,至少類似於市場為私人產品提供資金的方式。它不必是完美的;畢竟,市場本身遠非完美。但它應該足夠有效,讓致力於造福每個人的高質量開源項目的開發人員能夠繼續這樣做,而不需要做出不可接受的妥協。
今天,大多數d/acc相關領域的領先項目,如疫苗、腦機接、腕部肌電和眼動追等“邊緣腦機接口”、抗衰老藥物和硬件等,都是專有的。這在獲取公眾信任方面存在很大問題,正如我們在許多上述領域已經看到的那樣。這也使得人們的注意力轉向競爭(“我們的團隊必須贏得這個關鍵行業!”),而忽視了確保這些技術能夠快速發展,以便在超智能人工智能的世界中保護我們的更大競爭。因此,強有力的公共產品融資可以成為開放性和自由的重要推動力。這是加密社區可以幫助d/acc的另一種方式:通過深入探索這些融資機制並使其在自身環境中有效運作,為更廣泛的開源科學和技術的採用做好準備。
未來幾十年將帶來重大挑戰。最近我想到了兩個挑戰:
然而,每一個挑戰都有一線希望。第一的, 我們現在擁有非常強大的工具來更快地完成剩餘的工作:
其次,許多我們重視的原則不再被舊有特定群體所佔有,它們可以被任何人歡迎加入的廣泛聯盟重新奪回。這可能是最近全球政治“重組”帶來的最大好處,也是值得我們利用的機會。加密技術已經很好地抓住了這一點並找到了全球吸引力;d/acc同樣可以做到這一點。
獲得工具意味著我們能夠適應和改善我們的生物學和環境,而 d/acc 的“防禦”部分意味著我們能夠在不侵犯他人做同樣事情的自由的情況下做到這一點。 自由主義多元主義原則 意味著我們在實現這一目標的方式上可以有很大的多樣性,而我們對共同人類目標的承諾意味著它應該完成。
我們人類仍然是最閃亮的星星。我們面前的任務是建設一個更加光明的 21 世紀,在我們邁向星空的過程中保護人類的生存、自由和能動性,這是一項艱鉅的任務。但我相信我們能夠做到。
轉發原文標題:《d/acc:一年後》
大約一年前,我寫了一篇關於技術樂觀主義的文章,表達了我對技術的熱情以及它可能帶來的巨大好處,同時也對一些特定問題表示謹慎,主要集中在超智能人工智能上,以及如果技術構建不當可能導致的毀滅或人類的不可逆轉失能。文章中的一個核心思想是:去中心化和民主的差異化防禦加速。我們應該加速技術發展,但要重點關注那些增強我們防禦能力的技術,而不是造成傷害的技術,同時要確保權力的分散,而不是集中在某個精英手中。我們的防禦方式應像民主的瑞士和歷史上的準無政府狀態地區,而不是中世紀封建制度下的領主與城堡。
在過去的一年中,這一哲學和理念得到了顯著的發展。我在“80,000 小時”節目中討論了這些想法,並收到了許多反響,大多數是積極的,也有一些批評。我們的工作仍在繼續,並取得了一些成果:我們在可驗證的開源疫苗方面取得了進展,健康室內空氣的價值得到越來越多的認可,社區筆記繼續發揮作用,預測市場作為信息工具迎來了突破性的一年,零知識證明(ZK-SNARKs)在政府身份識別和社交媒體中得到了應用(並通過帳戶抽象 保護以太坊錢包),還有在醫學和腦機接口(BCI)中應用的開源成像工具等。去年秋天,我們舉行了第一次重要的d/acc活動:“d/acc發現日”(d/aDDy),在Devcon上進行了,活動中有來自d/acc各個領域(生物、物理、網絡、信息防禦和神經技術)的演講者。多年來從事這些技術研究的人們越來越意識到彼此的工作,而外部人士也越來越關注更大的背景:推動以太坊和加密貨幣的相同價值觀可以應用於更廣泛的世界。
現在是2042年。你在媒體上看到關於你所在城市可能出現新疫情的報道。你對此已經習慣:人們對每種動物疾病的突變總是過於興奮,而大多數情況最終並沒有發展成真正的疫情。之前的兩個潛在疫情通過廢水監測和社交媒體的開源分析被非常早地發現並完全遏制。但這一次,預測市場顯示至少有10,000例的概率為60%,因此你開始感到擔憂。
病毒的基因序列昨天被確認。你的便攜式空氣測試儀的軟件更新已經可以檢測新病毒(通過一次呼吸或在一個房間內暴露15分鐘的室內空氣)。使用任何現代醫療設施中可以找到的設備生成疫苗的開源說明和代碼預計在幾周內可用。目前大多數人尚未採取行動,主要依賴於普遍使用的空氣過濾和通風來保護自己。由於你有免疫系統疾病,所以更加謹慎:你的開源本地運行的個人助手AI,除了處理導航、餐廳和活動推薦外,還實時考慮空氣測試儀和二氧化碳數據,只推薦最安全的場所。這些數據由成千上萬的參與者和設備提供,利用零知識證明(ZK-SNARK)和差別隱私技術,最大程度降低數據洩露或被濫用的風險(如果你想為這些數據集貢獻數據,還有其他個人助手AI來驗證這些加密工具的有效性)。
兩個月後,疫情消失了:似乎60%的人遵循基本的防護措施,即當空氣測試儀發出警報並顯示病毒存在時戴上口罩,個人檢測陽性時待在家中,這足以將已經因重度空氣過濾而顯著降低的傳播率壓低到1以下。模擬顯示,二十年前可能比Covid嚴重五倍的疾病,如今卻成了無關緊要的問題。
![]() | ![]() |
Devcon d/acc 日
Devcon上的d/acc活動最積極的收穫之一是,d/acc的框架成功地將來自不同領域的人聚集在一起,使他們對彼此的工作產生了真正的興趣。
創建具有“多樣性”的活動很簡單,但讓不同背景和興趣的人真正相互聯繫卻很困難。我仍然記得在中學和高中時被迫觀看長時間的歌劇,而我個人覺得它們很無聊。我知道我“應該”欣賞它們,因為如果不這樣,我就會被認為是沒有文化的計算機科學粗人,但我並沒有在更真實的層面上與內容產生共鳴。d/acc日完全沒有這種感覺:人們似乎真的享受了解不同領域的不同工作。
如果我們想創造一個比統治、減速和毀滅更光明的替代方案,我們需要這種廣泛的聯盟建設。d/acc似乎確實在這方面取得了成功,這本身就顯示了這個理念的價值。
d/acc的核心思想很簡單:去中心化和民主的差異化防禦加速。
我們需要構建一些技術,使攻防平衡向防禦傾斜,並且不依賴於將更多權力交給集中權威。這兩者之間有著內在的聯繫:任何形式的去中心化、民主或自由的政治結構在防禦容易時發展最好,而在防禦困難時面臨最大的挑戰——在這種情況下,結果更可能是所有人相互對抗的戰爭,最終形成強者統治的局面。
d/acc的核心原則適用於多個領域:
圖表來自 My Techno-Optimis,
從我去年關於技術樂觀主義的文章中可以看出,理解同時追求去中心化、防禦性和加速思維的重要性的一種方法是將其與放棄這三者的哲學進行對比。
這種策略的挑戰有兩個方面。首先,從整體上看,技術和經濟增長對人類是極其有利的,任何延遲都會帶來難以估量的成本。其次,在一個非極權的世界中,不進步是不穩定的:誰“作弊”得最多,找到可信的方式繼續進步,誰就會領先。減速主義策略在某些背景下可以在一定程度上發揮作用:例如,歐洲食品比美國食品更健康就是一個例子,核不擴散至今的成功也是另一個。但它們不能永遠有效。
對於 d/acc,我們希望:
另一種理解d/acc的方法是回到2000年代末歐洲海盜黨運動的一個框架:賦權。
目標是構建一個保留人類自主權的世界,既實現避免他人(無論是作為私人公民的其他人,還是政府,或超智能機器人)主動干預的消極自由,又實現我們塑造自己命運的能力,以及確保我們擁有知識和資源的積極自由。這與幾個世紀以來的古典自由主義傳統相呼應,其中也包括斯圖爾特·布蘭德對“工具獲取”的關注,以及約翰·斯圖爾特·密爾將教育與自由視為人類進步的關鍵組成部分——或許,人們還可以補充,巴克敏斯特·富勒希望看到全球解決過程是參與性和廣泛分佈的。我們可以將d/acc視為在21世紀的技術背景下實現這些相同目標的一種方式。
在我去年的文章中,d/acc特別關注防禦性技術:物理防禦、生物防禦、網絡防禦和信息防禦。然而,去中心化的防禦不足以使世界變得偉大:你還需要一個前瞻性的積極願景,來說明人類如何利用其新獲得的去中心化和安全性來實現目標。
去年的文章確實包含了一個積極的願景,在兩個地方:
但這兩個觀點與d/acc的論點似乎沒有聯繫:“這裡有一些在基礎層面創造更民主和更有防禦性的世界的想法,順便提一下,這裡還有一些與超智能無關的想法。”
然而,我認為實際上,“防禦性”和“進步性”d/acc技術之間有一些非常重要的聯繫。讓我們通過增加這個軸(同時將其重新標記為“生存與發展”)來擴展去年的d/acc圖表,看看會有什麼結果:
在所有領域中,有一種一致的模式,即可以幫助我們在一個領域“生存”的科學、思想和工具與可以幫助我們“繁榮”的科學、思想和工具密切相關。一些例子:
此外,不同學科之間還存在重要的相互依賴關係:
不同的人對人工智能的時間線有很大差異。
這張圖來自2023年的黑山Zuzalu。
我去年文章中最有說服力的反對意見來自人工智能安全社區。論點是:“當然,如果我們還有半個世紀才能擁有強人工智能,我們可以集中精力構建所有這些好的東西。但實際上,看起來我們只有三年的時間線才能實現通用人工智能(AGI),再過三年才能實現超智能。因此,如果我們不想讓世界被毀滅或陷入不可逆轉的陷阱,我們不僅要加速好的事物,還必須減緩壞的事物,這意味著必須通過強有力的監管,這可能會讓有權勢的人感到不滿。”在我去年的文章中,我確實沒有呼籲任何具體的“減緩壞事物”的策略,除了對不構建風險形式的超智能的模糊呼籲。因此,在這裡,值得直接回答這個問題:如果我們生活在一個 最不方便的世界,人工智能風險高,時間線可能只有五年,我會支持什麼樣的監管?
去年,主要提出的人工智能監管是加利福尼亞州 SB-1047 法案。SB-1047要求最強大的模型的開發者(那些訓練成本超過1億美元,或微調超過1000萬美元的模型)在發佈之前採取一些安全測試措施。此外,如果他們未能盡到足夠的注意義務,法案還對人工智能模型的開發者施加責任。許多反對者認為該法案“威脅到開源”;我不同意,因為成本門檻意味著它隻影響最強大的模型:甚至LLama3可能都低於這個門檻。然而,回顧起來,我認為法案存在更大的問題:與大多數監管一樣,它過於適應當前的情況。對訓練成本的關注在面對新技術時顯得脆弱:最近的最先進的Deepseek v3模型的訓練成本僅600萬美元,而在新模型如o1中,成本正在更普遍地從訓練轉向推理。
其次,實際上負責人工智能超智能災難場景的最可能的參與者是軍方。
正如我們在去半個世紀的生物安全(及其他領域)中所見,軍方願意做一些可怕的事情,他們也容易犯錯誤。今天,人工智能在軍事上的應用正在迅速推進(參見烏克蘭、加沙)。而政府通過的任何安全監管,默認情況下都會使他們自己的軍隊和與軍隊緊密合作的公司免責。
儘管如此,這些論點並不是讓我們束手無策的理由。相反,我們可以將它們作為指南,嘗試制定儘量減少這些擔憂的規則。
如果某人以某種方式造成了法律上可追究的損害,他們可能會被起訴。這並不能解決來自軍方和其他“超越法律”行為者的風險問題,但這是一個非常通用的做法,避免了過度適應,並且通常得到傾向自由主義的經濟學家的支持,正是出於這個原因。
迄今為止已考慮的主要責任目標是:
將責任歸於用戶似乎是最符合激勵的。雖然模型的開發方式與最終使用方式之間的聯繫常常不清楚,但用戶確切決定了人工智能的使用方式。對用戶施加責任會產生強大的壓力,促使他們以我認為正確的方式使用人工智能:專注於為人類思維構建機械外骨骼,而不是創造新的自給自足的智能生命形式。前者會定期響應用戶意圖,因此不會導致災難性行為,除非用戶希望這樣。後者則有最大的風險,可能導致經典的“人工智能失控”場景。將責任儘可能接近最終使用的另一個好處是,它最大限度地減少了責任導致人們採取其他有害行動的風險(例如,閉源、KYC和監控、國家與企業勾結祕密限制用戶,例如取消銀行賬戶、鎖定世界大片區域)。
對僅將責任歸於用戶有一個經典的反對論點:用戶可能是沒有太多錢的普通個人,甚至是匿名的,沒有人能實際賠償災難性損害。這個論點可能被誇大:即使某些用戶太小而無法承擔責任,人工智能開發者的平均客戶並非如此,因此人工智能開發者仍然會有動力構建能夠讓用戶確信不會面臨高責任風險的產品。儘管如此,這仍然是一個有效的論點,需要得到解決。你需要激勵管道中的某個人,他們有資源採取適當的注意義務,而部署者和開發者都是容易的目標,他們仍然對模型的安全性或不安全性有很大的影響。
對部署者施加責任似乎是合理的。一個常被提到的擔憂是,這對開源模型可能不起作用,但這似乎是可以管理的,尤其是因為最強大的模型很可能無論如何都是閉源的(如果它們最終是開源的,那麼儘管部署者責任並沒有太大用處,但也不會造成太大傷害)。開發者責任也存在同樣的擔憂(儘管對於開源模型來說,需要微調模型以使其執行一些原本不允許的操作會有一些障礙),但同樣的反駁適用。作為一般原則,對控制施加“稅”,並基本上說“你可以構建你無法控制的東西,或者你可以構建你控制的東西,但如果你構建你控制的東西,那麼20%的控制必須用於我們的目的”,似乎是法律系統可以採取的合理立場。
一個似乎尚未得到充分探討的想法是將責任歸咎於管道中的其他參與者,這些參與者更能保證擁有充足的資源。一個對 d/acc 非常友好的想法是 讓人工智能接管的任何設備的所有者或操作員承擔責任 (例如通過黑客攻擊)在執行一些災難性有害操作的過程中。這將產生非常廣泛的激勵,促使人們努力工作,使世界(尤其是計算和生物)基礎設施儘可能安全。
如果我確信我們 需要 比責任規則更“強有力”的東西,這就是我想要的。目標是能夠在關鍵時期將全球可用計算量減少約 90-99%,持續 1-2 年,為人類爭取更多時間做好準備。 1-2年的價值不應被誇大:一年的“戰時模式”很容易抵得上在自滿的情況下工作一百年。實施方法“暫停“已經進行了探討,包括具體建議,例如 需要註冊 和 驗證位置 硬件。
更先進的方法是使用巧妙的加密技巧:例如,生產的工業規模(但不是消費級)人工智能硬件可以配備可信硬件芯片,只有在一次獲得 3/3 簽名的情況下才允許其繼續運行一週來自主要國際機構,包括至少一個非軍事附屬機構。簽名將是獨立於設備的(如果需要,我們甚至可以要求零知識證明它們是在區塊鏈上發佈的),因此這將是全有或全無:沒有實用的方法來授權一臺設備繼續運行而不授權所有其他設備。
這感覺就像它在利益最大化和風險最小化方面“勾選了複選框”:
硬件監管已經得到強烈考慮,儘管通常是通過 出口管制,其固有的理念是“我們信任自己的一方,但不信任對方”。利奧波德·阿申布倫納 (Leopold Aschenbrenner) 曾主張美國應該 爭奪決定性優勢 進而 本質上是在迫使中國 簽署一份 協議 限制多少 盒子 他們被允許奔跑。對我來說,這種方法似乎有風險,並且可能會結合以下缺陷: 多極種族 和集中化。如果我們必須限制人,那麼似乎更好的是在平等的基礎上限制每個人,並努力實際嘗試合作來組織這一點,而不是一個政黨試圖主宰其他所有人。
這兩種策略(責任和硬件暫停按鈕)都有不足之處,顯然它們只是臨時的解決方案:如果在某個時間點T時某項技術可以在超級計算機上實現,那麼在T+5年時,它很可能也能在普通筆記本電腦上實現。因此,我們需要更穩定的解決方案來爭取時間。許多d/acc技術在這方面是相關的。我們可以從以下幾個方面來看待d/acc技術的作用:如果人工智能接管了世界,它將如何做到這一點?
正如上面簡要提到的, 責任規則自然是一種對 d/acc 友好的監管方式,因為它們可以非常有效地激勵世界各地採用這些防禦措施並認真對待它們。臺灣 一直在嘗試 最近的虛假廣告責任,可以被視為利用責任鼓勵信息防禦的一個例子。我們不應該 也 熱衷於將責任無處不在,並記住普通自由的好處,使小人物能夠參與創新而不必擔心訴訟,但是當我們確實希望更有力地推動安全時,責任可以相當靈活和有效。
d/acc 的大部分內容遠遠超出了典型的區塊鏈主題:生物安全、BCI 和協作討論工具似乎與加密貨幣人士通常談論的事情相去甚遠。然而,我認為加密貨幣和 d/acc 之間存在一些重要的聯繫,特別是:
Cursive是一款應用,通過完全同態加密(FHE)允許用戶識別與其他用戶的共同興趣領域,同時保護隱私。這款應用在Zuzalu的眾多分支之一Edge City中使用,地點在清邁。
除了這些直接交叉點之外,還有另一個重要的共同興趣點: 籌資機制。
我一直感興趣的是尋找更好的機制來資助公共產品:對非常大群體有價值的項目,但沒有自然可行的商業模式。我過去在這方面的工作包括我對二次融資及其在Gitcoin Grants中的應用、復古公共產品融資(PGF),以及最近的深度融資的貢獻。
許多人對公共物品這個概念持懷疑態度。懷疑論通常有兩個來源:
這些都是重要的批評,也是好的批評。然而,我認為強大的去中心化公共產品資金對於 d/acc 願景至關重要,因為關鍵的 d/acc 目標(最小化中心控制點)本質上會挫敗許多傳統的商業模式。在開源基礎上建立成功的企業是可能的 - 一些 獎項 受贈者 正在這樣做 - 但在某些情況下,重要項目需要額外的持續支持已經夠困難的了。因此, 我們必須做困難的事情,並找出如何以解決上述批評的方式進行公共物品資助。
第一個問題的解決方案基本上是 可信的中立性 和 @VitalikButerin/the-meaning-of-decentralization-a0c92b76a274”>權力下放。中央計劃是有問題的,因為它把控制權交給了可能會濫用權力的精英,而且因為它經常 過度適應目前的情況 並且隨著時間的推移變得越來越無效。二次方融資和類似機制正是以一種儘可能可信的中立和(結構上和政治上)去中心化的方式為公共產品提供資金。
第二個問題更具挑戰性。對於二次方融資,一個常見的批評是它 很快就變成了一場人氣競賽,要求項目資助者花費大量精力公開宣傳。此外,“在人們眼前”的項目(例如最終用戶應用程序)會獲得資助,但更多的是在後臺的項目(原型“內布拉斯加州一個人維持的依賴”)根本得不到任何資金。樂觀復古資金依賴於較少數量的專家徽章持有者;在這裡,人氣競賽的影響被削弱,但與徽章持有者建立密切個人聯繫的社會影響被放大。
深度融資 是我自己為解決這個問題所做的最新努力。深度融資有兩個主要創新點:
但深度融資只是最新的例子。之前已經有過其他公共產品融資機制的想法,未來還會有更多。 同種異體專家 對它們進行很好的編目。 根本目標是創建一個社會工具,能夠以一定程度的準確性、公平性和開放性為公共產品提供資金,至少類似於市場為私人產品提供資金的方式。它不必是完美的;畢竟,市場本身遠非完美。但它應該足夠有效,讓致力於造福每個人的高質量開源項目的開發人員能夠繼續這樣做,而不需要做出不可接受的妥協。
今天,大多數d/acc相關領域的領先項目,如疫苗、腦機接、腕部肌電和眼動追等“邊緣腦機接口”、抗衰老藥物和硬件等,都是專有的。這在獲取公眾信任方面存在很大問題,正如我們在許多上述領域已經看到的那樣。這也使得人們的注意力轉向競爭(“我們的團隊必須贏得這個關鍵行業!”),而忽視了確保這些技術能夠快速發展,以便在超智能人工智能的世界中保護我們的更大競爭。因此,強有力的公共產品融資可以成為開放性和自由的重要推動力。這是加密社區可以幫助d/acc的另一種方式:通過深入探索這些融資機制並使其在自身環境中有效運作,為更廣泛的開源科學和技術的採用做好準備。
未來幾十年將帶來重大挑戰。最近我想到了兩個挑戰:
然而,每一個挑戰都有一線希望。第一的, 我們現在擁有非常強大的工具來更快地完成剩餘的工作:
其次,許多我們重視的原則不再被舊有特定群體所佔有,它們可以被任何人歡迎加入的廣泛聯盟重新奪回。這可能是最近全球政治“重組”帶來的最大好處,也是值得我們利用的機會。加密技術已經很好地抓住了這一點並找到了全球吸引力;d/acc同樣可以做到這一點。
獲得工具意味著我們能夠適應和改善我們的生物學和環境,而 d/acc 的“防禦”部分意味著我們能夠在不侵犯他人做同樣事情的自由的情況下做到這一點。 自由主義多元主義原則 意味著我們在實現這一目標的方式上可以有很大的多樣性,而我們對共同人類目標的承諾意味著它應該完成。
我們人類仍然是最閃亮的星星。我們面前的任務是建設一個更加光明的 21 世紀,在我們邁向星空的過程中保護人類的生存、自由和能動性,這是一項艱鉅的任務。但我相信我們能夠做到。