Pendekatan lain yang dieksplorasi oleh > dalam banyak kasus penggunaan adalah memiliki mekanik sederhana menjadi aturan permainan dan AI menjadi pemain.
Judul asli: "AI sebagai mesin, manusia sebagai roda kemudi"
Ditulis oleh: Vitalik, pendiri Ethereum
Diterjemahkan oleh: Bai Shui, Golden Finance
Jika Anda bertanya kepada orang-orang aspek apa dari struktur demokrasi yang mereka sukai, apakah itu pemerintah, tempat kerja, atau DAO berbasis blockchain, Anda akan sering mendengar argumen yang sama: mereka menghindari konsentrasi kekuasaan, mereka memberi pengguna jaminan kuat bahwa tidak ada yang dapat sepenuhnya mengubah arah sistem sesuka hati, dan mereka dapat membuat keputusan berkualitas lebih tinggi dengan mengumpulkan pandangan dan kebijaksanaan banyak orang.
Jika Anda bertanya kepada orang-orang apa yang tidak mereka sukai tentang struktur demokrasi, mereka sering memberikan keluhan yang sama: pemilih rata-rata tidak cukup canggih karena setiap pemilih hanya memiliki peluang kecil untuk mempengaruhi hasilnya, sangat sedikit pemilih yang memasukkan pemikiran berkualitas ke dalam pengambilan keputusan mereka, dan Anda sering mendapatkan keterlibatan rendah (membuat sistem rentan terhadap serangan) atau sentralisasi de facto karena semua orang default untuk mempercayai dan menyalin pandangan beberapa influencer.
Tujuan artikel ini adalah untuk mengeksplorasi paradigma di mana mungkin AI dapat digunakan untuk memungkinkan kita mendapatkan keuntungan dari struktur demokrasi tanpa efek negatif. "AI adalah mesinnya, manusia adalah kemudinya". Manusia hanya memberikan sejumlah kecil informasi ke sistem, mungkin hanya beberapa ratus, tetapi semuanya dipikirkan dengan baik dan berkualitas sangat tinggi. AI memperlakukan data ini sebagai "fungsi objektif" dan bekerja tanpa lelah untuk membuat banyak keputusan untuk melakukan yang terbaik untuk mencapai tujuan ini. Secara khusus, artikel ini akan mengeksplorasi pertanyaan menarik: Bisakah kita melakukan ini tanpa menempatkan AI tunggal di pusat, tetapi sebaliknya mengandalkan pasar terbuka yang kompetitif di mana setiap AI (atau hibrida manusia-mesin) dapat berpartisipasi secara bebas?
Indeks
Mengapa tidak langsung membiarkan AI mengelola?
Futarki
Distil Human Judgement
Pendanaan Dalam (Pendanaan Mendalam)
Menambahkan privasi
Manfaat desain mesin + setir
Mengapa tidak langsung menyerahkan kepada AI?
Cara termudah untuk menyisipkan preferensi manusia ke dalam mekanisme berbasis AI adalah dengan membuat model AI dan memungkinkan manusia untuk memasukkan preferensi mereka dengan cara tertentu. Ada cara sederhana untuk melakukannya: Anda hanya perlu menempatkan file teks yang berisi daftar instruksi dari orang ke dalam prompt sistem. Kemudian, Anda dapat menggunakan salah satu dari banyak 'kerangka AI agen' untuk memberi AI akses ke internet, memberikannya kunci untuk aset Anda dan profil media sosial yang Anda kelola, dan Anda pun sukses besar.
Setelah beberapa iterasi, ini mungkin cukup untuk memenuhi kebutuhan banyak kasus penggunaan, saya sepenuhnya memperkirakan bahwa dalam waktu dekat, kita akan melihat banyak struktur yang melibatkan aksi yang diambil dari instruksi yang diberikan oleh kelompok pembaca AI (bahkan obrolan grup secara real time).
Struktur ini tidak ideal sebagai mekanisme tata kelola sebagai lembaga jangka panjang. Atribut berharga yang harus dimiliki lembaga jangka panjang adalah kredibilitas dan netralitas. Dalam posting saya memperkenalkan konsep ini, saya mencantumkan empat atribut berharga netralitas yang kredibel:
Jangan menulis orang tertentu atau hasil tertentu ke dalam mekanisme
Eksekusi yang dapat diverifikasi secara terbuka dan dapat diverifikasi
Tetaplah sederhana
Jangan sering berubah
LLM (atau AI agen) memenuhi 0/4. Model ini tak terhindarkan akan mengkodekan preferensi orang dan hasil tertentu dalam proses pelatihannya. Terkadang ini dapat mengarah pada preferensi AI yang mengejutkan, seperti yang baru-baru ini ditunjukkan oleh sebuah penelitian yang menunjukkan bahwa LLM utama lebih memperhatikan kehidupan di Pakistan daripada di Amerika (!!). Ia dapat memiliki bobot terbuka, namun jauh dari sumber terbuka; kita benar-benar tidak tahu apa yang disembunyikan oleh model ini di dalamnya. Ini bertolak belakang dari yang sederhana: kompleksitas Kolmogorov LLM ini berjumlah miliaran digit, sekitar setara dengan total semua undang-undang Amerika (federal + negara + lokal). Dan karena perkembangan AI yang cepat, Anda harus mengubahnya setiap tiga bulan.
Untuk alasan ini, pendekatan lain yang saya lebih suka jelajahi dalam banyak kasus penggunaan adalah memiliki mekanik sederhana menjadi aturan permainan dan AI menjadi pemain. Wawasan inilah yang membuat pasar begitu efektif: aturannya adalah sistem hak milik yang relatif bodoh, kasus-kasus pinggiran diputuskan oleh sistem pengadilan yang perlahan-lahan menumpuk dan menyesuaikan preseden, dan semua intelijen berasal dari pengusaha yang beroperasi "di pinggiran".
Seorang "pemain game" individu dapat menjadi LLM, kelompok LLM yang saling berinteraksi dan menggunakan berbagai layanan internet, berbagai kombinasi AI + manusia, dan banyak konstruksi lainnya; sebagai perancang mekanisme, Anda tidak perlu tahu. Tujuan ideal adalah memiliki mekanisme yang dapat berjalan secara otomatis - jika tujuan mekanisme tersebut adalah untuk memilih apa yang akan didanai, maka seharusnya sebisa mungkin mirip dengan imbalan blok Bitcoin atau Ethereum.
Keuntungan dari metode ini adalah:
Ini menghindari memasukkan model tunggal ke dalam mekanisme; sebaliknya, Anda akan mendapatkan pasar terbuka yang terdiri dari banyak peserta dan arsitektur yang berbeda, masing-masing dengan biasnya sendiri. Model terbuka, model tertutup, agen kolektif, campuran manusia + AI, robot, monyet tak terbatas, semuanya adil bermain; mekanisme ini tidak akan mendiskriminasikan siapa pun.
Mekanisme ini open source. Meskipun pemainnya tidak, game-nya open source - dan ini adalah pola yang sudah cukup dipahami (misalnya, partai politik dan pasar beroperasi dengan cara ini)
Mekanismenya sederhana, sehingga ada relatif sedikit cara bagi perancang mekanisme untuk mengkodekan bias mereka sendiri ke dalam desain
Mekanisme ini tidak akan berubah, bahkan dari sekarang hingga titik aneh, arsitektur partisipan dasar perlu direkayasa ulang setiap tiga bulan sekali.
Tujuan mekanisme panduan adalah mencerminkan dengan setia tujuan pokok peserta. Hanya memerlukan sedikit informasi, tetapi harus berkualitas tinggi.
Anda dapat menganggap mekanisme ini sebagai mengambil keuntungan dari asimetri antara mengusulkan jawaban dan memvalidasinya. Ini mirip dengan Sudoku yang sulit dipecahkan, tetapi mudah untuk memverifikasi bahwa solusinya benar. Anda (i) membuat pasar terbuka bagi pemain untuk bertindak sebagai "pemecah masalah", dan kemudian (ii) mempertahankan mekanisme yang dijalankan manusia untuk melakukan tugas yang jauh lebih sederhana untuk memvalidasi solusi yang diusulkan.
Futarki
Futarchy awalnya diusulkan oleh Robin Hanson dan berarti "pilih nilai, tetapi bertaruh untuk iman". Mekanisme pemungutan suara memilih serangkaian tujuan (yang dapat berupa apa saja, tetapi hanya jika mereka harus dapat diukur) dan kemudian menggabungkannya menjadi metrik M. Ketika Anda perlu membuat keputusan (mari kita asumsikan YA / TIDAK untuk kesederhanaan), Anda menetapkan pasar bersyarat: Anda meminta orang untuk bertaruh apakah (i) akan memilih YA atau TIDAK, (ii) jika Anda memilih YA, nilai M, jika tidak nol, (iii) Nilai M jika NO dipilih, jika tidak maka nol. Dengan ketiga variabel ini, Anda dapat menentukan apakah pasar menganggap YA atau TIDAK lebih menguntungkan untuk nilai M.
"Harga saham perusahaan" (atau, dalam kasus cryptocurrency, harga token) adalah metrik yang paling sering dikutip karena mudah dipahami dan diukur, tetapi mekanismenya dapat mendukung berbagai metrik: pengguna aktif bulanan, median kebahagiaan yang dilaporkan sendiri untuk kelompok tertentu, beberapa metrik desentralisasi yang dapat diukur, dll.
Futarchy awalnya ditemukan sebelum era kecerdasan buatan. Namun, Futarchy sangat cocok dengan paradigma "pemecah kompleks, validator sederhana" yang dijelaskan di bagian sebelumnya, dan pedagang di Futarchy juga bisa menjadi kecerdasan buatan (atau kombinasi kecerdasan manusia + buatan). Peran "solver" (pedagang pasar prediktif) adalah untuk menentukan bagaimana setiap rencana yang diusulkan akan mempengaruhi nilai indikator masa depan. Sulit. Jika pemecah benar, mereka menghasilkan uang, dan jika pemecah salah, mereka kehilangan uang. Validator (orang yang memberikan suara pada indikator, jika mereka melihat bahwa metrik tersebut "dicurangi" atau ketinggalan zaman, menyesuaikan metrik dan menentukan nilai aktual metrik di beberapa titik di masa mendatang) hanya perlu menjawab pertanyaan yang lebih sederhana "Berapa nilai metrik sekarang?"
Menyaring penilaian manusia
Distilasi penilaian manusia adalah kelas mekanisme yang bekerja sebagai berikut. Ada banyak (pikirkan: 1 juta) pertanyaan yang perlu dijawab. Contoh alami meliputi:
Seberapa banyak penghargaan yang harus diberikan kepada setiap orang dalam daftar ini atas kontribusinya terhadap suatu proyek atau tugas?
Manakah dari komentar-komentar ini melanggar aturan platform media sosial (atau subkomunitas)?
Manakah dari alamat Ethereum yang diberikan mewakili orang yang sebenarnya dan unik?
Manakah dari benda-benda fisik ini yang berkontribusi positif atau negatif terhadap estetika lingkungan mereka?
Anda memiliki tim yang dapat menjawab pertanyaan-pertanyaan ini, tetapi dengan biaya menghabiskan banyak upaya untuk setiap jawaban. Anda hanya meminta tim untuk menjawab beberapa pertanyaan (misalnya, jika ada 1 juta item dalam daftar total, tim hanya dapat menjawab 100 di antaranya). Anda bahkan dapat mengajukan pertanyaan tidak langsung kepada tim: Jangan bertanya, "Berapa persen dari total kredit Alice yang harus dia terima?" alih-alih, tanyakan, "Haruskah Alice atau Bob mendapatkan lebih banyak pujian, dan berapa banyak?" Saat merancang mekanisme juri, Anda dapat menggunakan kembali mekanisme coba-dan-benar di dunia nyata, seperti komite hibah, pengadilan (untuk menentukan nilai penilaian), penilaian, dan tentu saja, peserta juri sendiri dapat menggunakan alat penelitian AI baru untuk membantu mereka menemukan jawaban.
Kemudian, Anda mengizinkan siapa pun untuk mengirimkan daftar jawaban numerik untuk seluruh kumpulan pertanyaan (misalnya, memberikan perkiraan nilai kredit yang harus diterima oleh setiap peserta dalam daftar). Peserta didorong untuk menggunakan kecerdasan buatan untuk menyelesaikan tugas ini, tetapi mereka dapat menggunakan berbagai teknologi: kecerdasan buatan, campuran manusia-mesin, kecerdasan buatan yang dapat mengakses pencarian internet dan dapat mempekerjakan manusia atau kecerdasan buatan lain secara mandiri, misalnya monyet yang ditingkatkan dengan teori kontrol.
Setelah penyedia daftar lengkap dan juri mengirimkan jawaban mereka, daftar lengkap diperiksa terhadap jawaban juri, dan kombinasi tertentu dari daftar lengkap yang paling kompatibel dengan jawaban juri digunakan sebagai jawaban akhir.
Mekanisme penilaian manusia yang terdistilasi berbeda dari futarki, tetapi memiliki beberapa persamaan penting:
Dalam futarki, "pemecah" membuat prediksi, dan "data nyata" yang menjadi dasar prediksi mereka (digunakan untuk memberi penghargaan atau menghukum pemecah) adalah oracle yang menghasilkan nilai indikator, dijalankan oleh juri.
Dalam penilaian manusia yang terdistil, 'perhitung' akan memberikan jawaban untuk sejumlah besar pertanyaan, sementara 'data nyata' yang menjadi dasar prediksi mereka adalah sebagian kecil jawaban berkualitas tinggi dari juri.
Contoh mainan untuk menyaring penilaian manusia untuk distribusi kredit, lihat kode Python di sini. Skrip meminta Anda untuk bertindak sebagai juri dan menyertakan daftar lengkap yang dihasilkan AI (dan dihasilkan manusia) beberapa pra-termasuk dalam kode. Mekanisme ini mengidentifikasi kombinasi linier yang paling cocok untuk daftar lengkap jawaban juri. Dalam hal ini, kombinasi yang menang adalah 0,199 * jawaban Claude + 0,801 * jawaban Deepseek; Kombinasi ini lebih sesuai dengan jawaban juri daripada model tunggal mana pun. Koefisien ini juga akan menjadi hadiah bagi committer.
Dalam contoh 'mengalahkan Sauron' ini, aspek 'manusia sebagai setir' tercermin dalam dua hal. Pertama, setiap masalah menerapkan penilaian manusia berkualitas tinggi, meskipun masih menggunakan juri sebagai penilai kinerja 'birokrat teknologi'. Kedua, ada mekanisme pemungutan suara tersirat yang menentukan apakah 'mengalahkan Sauron' adalah tujuan yang benar (bukan, misalnya, mencoba bersekutu dengan Sauron, atau memberikan semua wilayah di sebelah timur sungai penting kepadanya sebagai konsesi perdamaian). Ada juga kasus penggunaan penilaian manusia yang lebih distil, di mana tugas juri secara lebih langsung mengandung nilai-nilai: misalnya, bayangkan platform media sosial (atau subkomunitas), di mana tugas juri adalah menandai posting forum yang dipilih secara acak sebagai patuh atau melanggar aturan komunitas.
Dalam paradigma penilaian manusia distilasi, ada beberapa variabel terbuka:
Bagaimana pengambilan sampel dilakukan? Peran pengirim daftar lengkap adalah memberikan sejumlah besar jawaban; Peran juri adalah memberikan jawaban berkualitas tinggi. Kita perlu memilih juri sedemikian rupa sehingga kemampuan model untuk mencocokkan jawaban juri adalah indikasi terbesar dari kinerja keseluruhannya. Beberapa pertimbangan meliputi:
Seimbang antara Pengetahuan Profesional dan Prasangka: Juri yang terampil biasanya memiliki spesialisasi dalam bidang profesional mereka, sehingga dengan membiarkan mereka memilih konten yang akan dinilai, Anda akan mendapatkan masukan yang lebih berkualitas. Di sisi lain, terlalu banyak pilihan dapat menyebabkan prasangka (juri cenderung memilih konten yang terkait dengan mereka) atau kelemahan dalam sampel (beberapa konten secara sistematis tidak dinilai).
*反古德哈特:Akan ada upaya untuk 'memanipulasi' mekanisme kecerdasan buatan, misalnya, kontributor menghasilkan sejumlah besar kode yang terlihat mengesankan tetapi tidak berguna. Ini berarti juri bisa mendeteksinya, tetapi model kecerdasan buatan statis tidak akan mendeteksinya kecuali mereka berusaha keras. Salah satu cara untuk mendeteksi perilaku ini adalah dengan menambahkan mekanisme tantangan di mana individu dapat menandai upaya semacam ini, memastikan juri mendapat penilaian (sehingga mendorong pengembang kecerdasan buatan untuk memastikan mereka menangkapnya dengan benar). Jika juri setuju, pelapor akan mendapat imbalan, jika tidak, mereka harus membayar denda.
Apa fungsi skor yang Anda gunakan? Salah satu gagasan yang digunakan dalam uji coba pendanaan mendalam saat ini adalah meminta juri "A atau B seharusnya mendapatkan lebih banyak kredit, dan seberapa banyak?". Fungsi skor adalah score(x) = sum((log(x[B]) - log(x[A]) - log(juror_ratio)) ** 2 untuk (A, B, juror_ratio) dalam jury_answers): Artinya, untuk setiap jawaban juri, itu akan bertanya seberapa jauh dari rasio dalam daftar lengkap dan rasio yang diberikan oleh juri, dan menambahkan hukuman yang sebanding dengan jarak kuadratnya (di ruang logaritma). Ini untuk menunjukkan bahwa ruang desain fungsi skor sangat kaya, dan pilihan fungsi skor terkait dengan pertanyaan apa yang Anda ajukan kepada juri.
Bagaimana Anda memberi penghargaan kepada pengirim daftar lengkap? Idealnya, Anda ingin memberikan imbalan yang tidak nol kepada banyak peserta secara teratur untuk menghindari mekanisme monopoli, tetapi Anda juga ingin memenuhi atribut berikut: Peserta tidak dapat meningkatkan imbalan dengan mengirimkan kumpulan jawaban yang sama (atau sedikit dimodifikasi) berulang kali. Salah satu metode yang menjanjikan adalah dengan menghitung kombinasi linier dari daftar lengkap yang paling cocok dengan jawaban juri (koefisien non-negatif dan jumlahnya 1), dan menggunakan koefisien yang sama untuk membagi imbalan. Mungkin ada metode lain.
Secara keseluruhan, tujuannya adalah untuk menggunakan mekanisme penilaian manusia yang diketahui efektif, meminimalkan bias, dan telah teruji dari waktu ke waktu (misalnya, bayangkan bagaimana sistem pengadilan melibatkan dua pihak yang berselisih, mereka memiliki banyak informasi tetapi memiliki bias, sementara hakim memiliki sedikit informasi tetapi mungkin tidak memiliki bias), dan menggunakan pasar kecerdasan buatan terbuka sebagai indikator prediksi yang masuk akal, sangat akurat, dan biaya rendah untuk mekanisme tersebut (ini mirip dengan cara kerja model prediksi besar 'distilasi').
深度融资(deep funding)
Pembiayaan mendalam adalah menerapkan penilaian distilasi manusia untuk mengisi pertanyaan "Berapa persentase kredit X milik Y?" Masalah pembobotan di bagian atas grafik.
Cara paling sederhana adalah dengan langsung memberikan contoh:
Output contoh pendanaan kedalaman dua tingkat: asal muasal pemikiran Ethereum. Silakan lihat kode Python di sini.
Tujuan di sini adalah untuk mengalokasikan penghargaan filosofis terhadap kontribusi terhadap Ethereum. Mari kita lihat contoh:
Simulasi putaran pendanaan mendalam di sini menyalahkan 20.5% pada gerakan cyberpunk dan 9.2% pada progresivisme teknologi.
Di setiap node, Anda akan menghadapi pertanyaan: sejauh mana kontribusi asli (sehingga layak mendapat penghargaan), sejauh mana merupakan penggabungan kembali dari pengaruh hulu lainnya? Untuk gerakan kriptopunk, 40% adalah baru, 60% adalah dependen.
Kemudian, Anda dapat melihat dampak dari aliran-aliran ini: liberalisme kecil pemerintahan dan anarkisme berkontribusi 17,3% terhadap gerakan kriptopunk, tetapi demokrasi langsung Swiss hanya mendapat 5%.
Perhatikan, bagaimanapun, bahwa pemerintahan kecil liberal dan anarkisme juga mengilhami filosofi moneter Bitcoin, sehingga mempengaruhi filosofi Ethereum dalam dua cara.
Untuk menghitung kontribusi total liberalisme kecil pemerintahan dan anarkisme terhadap Ethereum, Anda perlu mengalikan setiap tepi pada setiap jalur, kemudian menjumlahkan jalur tersebut: 0.205 * 0.6 * 0.173 + 0.195 * 0.648 * 0.201 ~= 0.0466. Oleh karena itu, jika Anda harus menyumbangkan 100 dolar untuk memberi penghargaan kepada semua orang yang berkontribusi pada filsafat Ethereum, berdasarkan putaran pendanaan simulasi ini, penganut liberalisme kecil pemerintahan dan anarkis akan menerima 4,66 dolar.
Metode ini dimaksudkan untuk digunakan di bidang-bidang yang bekerja pada dasar kerja sebelumnya dan memiliki struktur yang sangat jelas. Dunia akademis (pikirkan: kutipan gambar) dan perangkat lunak sumber terbuka (pikirkan: ketergantungan pustaka dan fork) adalah dua contoh alami.
Tujuan dari sistem pendanaan kedalaman yang beroperasi dengan baik adalah menciptakan dan menjaga graf global, di mana para pendana yang tertarik dalam mendukung proyek tertentu dapat mengirimkan dana ke alamat yang mewakili simpul tersebut, dan dana akan secara otomatis menyebar berdasarkan bobot tepi graf ke dependensi mereka (dan rekursif ke dependensi mereka, dan seterusnya).
Anda dapat membayangkan protokol desentralisasi menggunakan perangkat pembiayaan dalam kedalaman bawaan untuk menerbitkan tokennya: tata kelola desentralisasi dalam protokol akan memilih sekelompok juri, juri akan menjalankan mekanisme pembiayaan dalam kedalaman karena protokol akan secara otomatis menerbitkan token dan menyimpannya di node yang sesuai dengannya. Dengan melakukan hal ini, protokol memberikan insentif kepada semua kontributor langsung dan tidak langsung secara berbasis kode, mengingatkan pada cara Bitcoin atau Ethereum memberikan insentif kepada jenis kontributor tertentu (penambang). Dengan mempengaruhi bobot pinggiran, juri dapat terus mendefinisikan jenis kontribusi yang mereka hargai. Mekanisme ini dapat berfungsi sebagai alternatif desentralisasi dan berkelanjutan jangka panjang untuk penambangan, penjualan, atau airdrop sekali jalan.
Peningkatan privasi
Biasanya, untuk membuat penilaian yang benar terhadap masalah dalam contoh di atas, diperlukan akses ke informasi pribadi: catatan obrolan internal organisasi, informasi yang dikirimkan secara rahasia oleh anggota komunitas, dll. Salah satu keuntungan dari 'menggunakan hanya satu AI', terutama dalam lingkungan yang lebih kecil, adalah bahwa memungkinkan satu AI untuk mengakses informasi lebih mudah diterima daripada mempublikasikan informasi kepada semua orang.
Untuk membuat penilaian manusia atau pembiayaan dalam kedua situasi ini berperan, kita dapat mencoba menggunakan teknologi enkripsi untuk memungkinkan AI mengakses informasi pribadi secara aman. Konsep ini melibatkan penggunaan komputasi multipihak (MPC) (, enkripsi homomorfik penuh (FHE) ), lingkungan eksekusi tepercaya (TEE) (, atau mekanisme serupa untuk menyediakan informasi pribadi, tetapi hanya jika output uniknya langsung dimasukkan ke dalam mekanisme 'submit daftar lengkap'.
Jika Anda melakukan hal ini, maka Anda harus membatasi kumpulan mekanisme ke model AI (bukan kombinasi manusia atau AI + manusia, karena Anda tidak bisa membiarkan manusia melihat data), dan khusus untuk dijalankan dalam beberapa basis tertentu (misalnya MPC, FHE, perangkat keras tepercaya) model. Salah satu arah penelitian utama adalah menemukan versi praktis yang cukup efektif dan bermakna dalam waktu dekat.
Keunggulan Desain Mesin + Kemudi
Desain ini memiliki banyak manfaat yang sangat diantisipasi. Sampai saat ini, manfaat terpentingnya adalah bahwa mereka memungkinkan pembangunan DAO, yang memungkinkan pemilih manusia mengendalikan arahnya, tetapi mereka tidak akan terganggu oleh terlalu banyak keputusan. Mereka mencapai keseimbangan, di mana setiap orang tidak perlu membuat N keputusan, tetapi kekuatan yang mereka miliki bukan hanya membuat satu keputusan (biasanya bagaimana delegasi bekerja), tetapi juga dapat memicu preferensi kaya yang sulit untuk diungkapkan secara langsung.
Selain itu, mekanisme ini tampaknya memiliki sifat insentif yang halus. Yang saya maksud dengan 'insentif halus' di sini adalah kombinasi dari dua faktor:
Proliferasi: Setiap tindakan tunggal yang diambil oleh mekanisme pemungutan suara tidak akan memiliki dampak yang tidak proporsional pada kepentingan setiap peserta tunggal.
Kekacauan: Hubungan antara keputusan pemungutan suara dan bagaimana mereka mempengaruhi kepentingan peserta menjadi lebih kompleks dan sulit dihitung.
Konfusi dan penyebaran di sini adalah dua istilah yang berasal dari kriptografi, dan keduanya adalah atribut kunci keamanan kriptografi dan fungsi hash.
Sebuah contoh bagus dari insentif yang halus di dunia nyata saat ini adalah hukum: para pejabat pemerintah tidak secara teratur mengambil tindakan dalam bentuk 'berikan 200 juta dolar kepada perusahaan Alice', 'denda perusahaan Bob sebesar 100 juta dolar', tetapi melalui aturan yang dirancang untuk diterapkan secara merata kepada sejumlah besar peserta, kemudian diinterpretasikan oleh jenis peserta lain. Ketika pendekatan ini berhasil, manfaatnya adalah mengurangi secara signifikan suap dan bentuk korupsi lainnya. Ketika dilanggar (yang sering terjadi dalam praktik), masalah-masalah ini dengan cepat membesar.
AI jelas akan menjadi bagian penting di masa depan, ini akan menjadi bagian penting dari tata kelola di masa depan. Namun, jika Anda melibatkan AI dalam tata kelola, ada risiko yang jelas: AI memiliki bias, mungkin sengaja dihancurkan selama proses pelatihan, dan perkembangan teknologi AI begitu cepat sehingga 'membiarkan AI berkuasa' mungkin sebenarnya berarti 'membiarkan orang yang bertanggung jawab atas peningkatan AI berkuasa'. Mengasah penilaian manusia memberikan jalan pengganti yang memungkinkan kita menggunakan kekuatan AI dengan cara pasar bebas terbuka, sambil tetap mempertahankan kendali demokratis manusia.
Terima kasih khusus kepada Devansh Mehta, Davide Crapis, dan Julian Zawistowski untuk umpan balik dan tinjauan mereka, serta diskusi dengan Tina Zhen, Shaw Walters, dan orang lain.
Konten ini hanya untuk referensi, bukan ajakan atau tawaran. Tidak ada nasihat investasi, pajak, atau hukum yang diberikan. Lihat Penafian untuk pengungkapan risiko lebih lanjut.
Vitalik New Article: Paradigma Tata Kelola Masa Depan 'Mesin AI + Kemudi Manusia'
Pendekatan lain yang dieksplorasi oleh > dalam banyak kasus penggunaan adalah memiliki mekanik sederhana menjadi aturan permainan dan AI menjadi pemain.
Judul asli: "AI sebagai mesin, manusia sebagai roda kemudi"
Ditulis oleh: Vitalik, pendiri Ethereum
Diterjemahkan oleh: Bai Shui, Golden Finance
Jika Anda bertanya kepada orang-orang aspek apa dari struktur demokrasi yang mereka sukai, apakah itu pemerintah, tempat kerja, atau DAO berbasis blockchain, Anda akan sering mendengar argumen yang sama: mereka menghindari konsentrasi kekuasaan, mereka memberi pengguna jaminan kuat bahwa tidak ada yang dapat sepenuhnya mengubah arah sistem sesuka hati, dan mereka dapat membuat keputusan berkualitas lebih tinggi dengan mengumpulkan pandangan dan kebijaksanaan banyak orang.
Jika Anda bertanya kepada orang-orang apa yang tidak mereka sukai tentang struktur demokrasi, mereka sering memberikan keluhan yang sama: pemilih rata-rata tidak cukup canggih karena setiap pemilih hanya memiliki peluang kecil untuk mempengaruhi hasilnya, sangat sedikit pemilih yang memasukkan pemikiran berkualitas ke dalam pengambilan keputusan mereka, dan Anda sering mendapatkan keterlibatan rendah (membuat sistem rentan terhadap serangan) atau sentralisasi de facto karena semua orang default untuk mempercayai dan menyalin pandangan beberapa influencer.
Tujuan artikel ini adalah untuk mengeksplorasi paradigma di mana mungkin AI dapat digunakan untuk memungkinkan kita mendapatkan keuntungan dari struktur demokrasi tanpa efek negatif. "AI adalah mesinnya, manusia adalah kemudinya". Manusia hanya memberikan sejumlah kecil informasi ke sistem, mungkin hanya beberapa ratus, tetapi semuanya dipikirkan dengan baik dan berkualitas sangat tinggi. AI memperlakukan data ini sebagai "fungsi objektif" dan bekerja tanpa lelah untuk membuat banyak keputusan untuk melakukan yang terbaik untuk mencapai tujuan ini. Secara khusus, artikel ini akan mengeksplorasi pertanyaan menarik: Bisakah kita melakukan ini tanpa menempatkan AI tunggal di pusat, tetapi sebaliknya mengandalkan pasar terbuka yang kompetitif di mana setiap AI (atau hibrida manusia-mesin) dapat berpartisipasi secara bebas?
Indeks
Mengapa tidak langsung menyerahkan kepada AI?
Cara termudah untuk menyisipkan preferensi manusia ke dalam mekanisme berbasis AI adalah dengan membuat model AI dan memungkinkan manusia untuk memasukkan preferensi mereka dengan cara tertentu. Ada cara sederhana untuk melakukannya: Anda hanya perlu menempatkan file teks yang berisi daftar instruksi dari orang ke dalam prompt sistem. Kemudian, Anda dapat menggunakan salah satu dari banyak 'kerangka AI agen' untuk memberi AI akses ke internet, memberikannya kunci untuk aset Anda dan profil media sosial yang Anda kelola, dan Anda pun sukses besar.
Setelah beberapa iterasi, ini mungkin cukup untuk memenuhi kebutuhan banyak kasus penggunaan, saya sepenuhnya memperkirakan bahwa dalam waktu dekat, kita akan melihat banyak struktur yang melibatkan aksi yang diambil dari instruksi yang diberikan oleh kelompok pembaca AI (bahkan obrolan grup secara real time).
Struktur ini tidak ideal sebagai mekanisme tata kelola sebagai lembaga jangka panjang. Atribut berharga yang harus dimiliki lembaga jangka panjang adalah kredibilitas dan netralitas. Dalam posting saya memperkenalkan konsep ini, saya mencantumkan empat atribut berharga netralitas yang kredibel:
LLM (atau AI agen) memenuhi 0/4. Model ini tak terhindarkan akan mengkodekan preferensi orang dan hasil tertentu dalam proses pelatihannya. Terkadang ini dapat mengarah pada preferensi AI yang mengejutkan, seperti yang baru-baru ini ditunjukkan oleh sebuah penelitian yang menunjukkan bahwa LLM utama lebih memperhatikan kehidupan di Pakistan daripada di Amerika (!!). Ia dapat memiliki bobot terbuka, namun jauh dari sumber terbuka; kita benar-benar tidak tahu apa yang disembunyikan oleh model ini di dalamnya. Ini bertolak belakang dari yang sederhana: kompleksitas Kolmogorov LLM ini berjumlah miliaran digit, sekitar setara dengan total semua undang-undang Amerika (federal + negara + lokal). Dan karena perkembangan AI yang cepat, Anda harus mengubahnya setiap tiga bulan.
Untuk alasan ini, pendekatan lain yang saya lebih suka jelajahi dalam banyak kasus penggunaan adalah memiliki mekanik sederhana menjadi aturan permainan dan AI menjadi pemain. Wawasan inilah yang membuat pasar begitu efektif: aturannya adalah sistem hak milik yang relatif bodoh, kasus-kasus pinggiran diputuskan oleh sistem pengadilan yang perlahan-lahan menumpuk dan menyesuaikan preseden, dan semua intelijen berasal dari pengusaha yang beroperasi "di pinggiran".
Seorang "pemain game" individu dapat menjadi LLM, kelompok LLM yang saling berinteraksi dan menggunakan berbagai layanan internet, berbagai kombinasi AI + manusia, dan banyak konstruksi lainnya; sebagai perancang mekanisme, Anda tidak perlu tahu. Tujuan ideal adalah memiliki mekanisme yang dapat berjalan secara otomatis - jika tujuan mekanisme tersebut adalah untuk memilih apa yang akan didanai, maka seharusnya sebisa mungkin mirip dengan imbalan blok Bitcoin atau Ethereum.
Keuntungan dari metode ini adalah:
Tujuan mekanisme panduan adalah mencerminkan dengan setia tujuan pokok peserta. Hanya memerlukan sedikit informasi, tetapi harus berkualitas tinggi.
Anda dapat menganggap mekanisme ini sebagai mengambil keuntungan dari asimetri antara mengusulkan jawaban dan memvalidasinya. Ini mirip dengan Sudoku yang sulit dipecahkan, tetapi mudah untuk memverifikasi bahwa solusinya benar. Anda (i) membuat pasar terbuka bagi pemain untuk bertindak sebagai "pemecah masalah", dan kemudian (ii) mempertahankan mekanisme yang dijalankan manusia untuk melakukan tugas yang jauh lebih sederhana untuk memvalidasi solusi yang diusulkan.
Futarki
Futarchy awalnya diusulkan oleh Robin Hanson dan berarti "pilih nilai, tetapi bertaruh untuk iman". Mekanisme pemungutan suara memilih serangkaian tujuan (yang dapat berupa apa saja, tetapi hanya jika mereka harus dapat diukur) dan kemudian menggabungkannya menjadi metrik M. Ketika Anda perlu membuat keputusan (mari kita asumsikan YA / TIDAK untuk kesederhanaan), Anda menetapkan pasar bersyarat: Anda meminta orang untuk bertaruh apakah (i) akan memilih YA atau TIDAK, (ii) jika Anda memilih YA, nilai M, jika tidak nol, (iii) Nilai M jika NO dipilih, jika tidak maka nol. Dengan ketiga variabel ini, Anda dapat menentukan apakah pasar menganggap YA atau TIDAK lebih menguntungkan untuk nilai M.
"Harga saham perusahaan" (atau, dalam kasus cryptocurrency, harga token) adalah metrik yang paling sering dikutip karena mudah dipahami dan diukur, tetapi mekanismenya dapat mendukung berbagai metrik: pengguna aktif bulanan, median kebahagiaan yang dilaporkan sendiri untuk kelompok tertentu, beberapa metrik desentralisasi yang dapat diukur, dll.
Futarchy awalnya ditemukan sebelum era kecerdasan buatan. Namun, Futarchy sangat cocok dengan paradigma "pemecah kompleks, validator sederhana" yang dijelaskan di bagian sebelumnya, dan pedagang di Futarchy juga bisa menjadi kecerdasan buatan (atau kombinasi kecerdasan manusia + buatan). Peran "solver" (pedagang pasar prediktif) adalah untuk menentukan bagaimana setiap rencana yang diusulkan akan mempengaruhi nilai indikator masa depan. Sulit. Jika pemecah benar, mereka menghasilkan uang, dan jika pemecah salah, mereka kehilangan uang. Validator (orang yang memberikan suara pada indikator, jika mereka melihat bahwa metrik tersebut "dicurangi" atau ketinggalan zaman, menyesuaikan metrik dan menentukan nilai aktual metrik di beberapa titik di masa mendatang) hanya perlu menjawab pertanyaan yang lebih sederhana "Berapa nilai metrik sekarang?"
Menyaring penilaian manusia
Distilasi penilaian manusia adalah kelas mekanisme yang bekerja sebagai berikut. Ada banyak (pikirkan: 1 juta) pertanyaan yang perlu dijawab. Contoh alami meliputi:
Anda memiliki tim yang dapat menjawab pertanyaan-pertanyaan ini, tetapi dengan biaya menghabiskan banyak upaya untuk setiap jawaban. Anda hanya meminta tim untuk menjawab beberapa pertanyaan (misalnya, jika ada 1 juta item dalam daftar total, tim hanya dapat menjawab 100 di antaranya). Anda bahkan dapat mengajukan pertanyaan tidak langsung kepada tim: Jangan bertanya, "Berapa persen dari total kredit Alice yang harus dia terima?" alih-alih, tanyakan, "Haruskah Alice atau Bob mendapatkan lebih banyak pujian, dan berapa banyak?" Saat merancang mekanisme juri, Anda dapat menggunakan kembali mekanisme coba-dan-benar di dunia nyata, seperti komite hibah, pengadilan (untuk menentukan nilai penilaian), penilaian, dan tentu saja, peserta juri sendiri dapat menggunakan alat penelitian AI baru untuk membantu mereka menemukan jawaban.
Kemudian, Anda mengizinkan siapa pun untuk mengirimkan daftar jawaban numerik untuk seluruh kumpulan pertanyaan (misalnya, memberikan perkiraan nilai kredit yang harus diterima oleh setiap peserta dalam daftar). Peserta didorong untuk menggunakan kecerdasan buatan untuk menyelesaikan tugas ini, tetapi mereka dapat menggunakan berbagai teknologi: kecerdasan buatan, campuran manusia-mesin, kecerdasan buatan yang dapat mengakses pencarian internet dan dapat mempekerjakan manusia atau kecerdasan buatan lain secara mandiri, misalnya monyet yang ditingkatkan dengan teori kontrol.
Setelah penyedia daftar lengkap dan juri mengirimkan jawaban mereka, daftar lengkap diperiksa terhadap jawaban juri, dan kombinasi tertentu dari daftar lengkap yang paling kompatibel dengan jawaban juri digunakan sebagai jawaban akhir.
Mekanisme penilaian manusia yang terdistilasi berbeda dari futarki, tetapi memiliki beberapa persamaan penting:
Contoh mainan untuk menyaring penilaian manusia untuk distribusi kredit, lihat kode Python di sini. Skrip meminta Anda untuk bertindak sebagai juri dan menyertakan daftar lengkap yang dihasilkan AI (dan dihasilkan manusia) beberapa pra-termasuk dalam kode. Mekanisme ini mengidentifikasi kombinasi linier yang paling cocok untuk daftar lengkap jawaban juri. Dalam hal ini, kombinasi yang menang adalah 0,199 * jawaban Claude + 0,801 * jawaban Deepseek; Kombinasi ini lebih sesuai dengan jawaban juri daripada model tunggal mana pun. Koefisien ini juga akan menjadi hadiah bagi committer.
Dalam contoh 'mengalahkan Sauron' ini, aspek 'manusia sebagai setir' tercermin dalam dua hal. Pertama, setiap masalah menerapkan penilaian manusia berkualitas tinggi, meskipun masih menggunakan juri sebagai penilai kinerja 'birokrat teknologi'. Kedua, ada mekanisme pemungutan suara tersirat yang menentukan apakah 'mengalahkan Sauron' adalah tujuan yang benar (bukan, misalnya, mencoba bersekutu dengan Sauron, atau memberikan semua wilayah di sebelah timur sungai penting kepadanya sebagai konsesi perdamaian). Ada juga kasus penggunaan penilaian manusia yang lebih distil, di mana tugas juri secara lebih langsung mengandung nilai-nilai: misalnya, bayangkan platform media sosial (atau subkomunitas), di mana tugas juri adalah menandai posting forum yang dipilih secara acak sebagai patuh atau melanggar aturan komunitas.
Dalam paradigma penilaian manusia distilasi, ada beberapa variabel terbuka:
Secara keseluruhan, tujuannya adalah untuk menggunakan mekanisme penilaian manusia yang diketahui efektif, meminimalkan bias, dan telah teruji dari waktu ke waktu (misalnya, bayangkan bagaimana sistem pengadilan melibatkan dua pihak yang berselisih, mereka memiliki banyak informasi tetapi memiliki bias, sementara hakim memiliki sedikit informasi tetapi mungkin tidak memiliki bias), dan menggunakan pasar kecerdasan buatan terbuka sebagai indikator prediksi yang masuk akal, sangat akurat, dan biaya rendah untuk mekanisme tersebut (ini mirip dengan cara kerja model prediksi besar 'distilasi').
深度融资(deep funding)
Pembiayaan mendalam adalah menerapkan penilaian distilasi manusia untuk mengisi pertanyaan "Berapa persentase kredit X milik Y?" Masalah pembobotan di bagian atas grafik.
Cara paling sederhana adalah dengan langsung memberikan contoh:
Output contoh pendanaan kedalaman dua tingkat: asal muasal pemikiran Ethereum. Silakan lihat kode Python di sini.
Tujuan di sini adalah untuk mengalokasikan penghargaan filosofis terhadap kontribusi terhadap Ethereum. Mari kita lihat contoh:
Metode ini dimaksudkan untuk digunakan di bidang-bidang yang bekerja pada dasar kerja sebelumnya dan memiliki struktur yang sangat jelas. Dunia akademis (pikirkan: kutipan gambar) dan perangkat lunak sumber terbuka (pikirkan: ketergantungan pustaka dan fork) adalah dua contoh alami.
Tujuan dari sistem pendanaan kedalaman yang beroperasi dengan baik adalah menciptakan dan menjaga graf global, di mana para pendana yang tertarik dalam mendukung proyek tertentu dapat mengirimkan dana ke alamat yang mewakili simpul tersebut, dan dana akan secara otomatis menyebar berdasarkan bobot tepi graf ke dependensi mereka (dan rekursif ke dependensi mereka, dan seterusnya).
Anda dapat membayangkan protokol desentralisasi menggunakan perangkat pembiayaan dalam kedalaman bawaan untuk menerbitkan tokennya: tata kelola desentralisasi dalam protokol akan memilih sekelompok juri, juri akan menjalankan mekanisme pembiayaan dalam kedalaman karena protokol akan secara otomatis menerbitkan token dan menyimpannya di node yang sesuai dengannya. Dengan melakukan hal ini, protokol memberikan insentif kepada semua kontributor langsung dan tidak langsung secara berbasis kode, mengingatkan pada cara Bitcoin atau Ethereum memberikan insentif kepada jenis kontributor tertentu (penambang). Dengan mempengaruhi bobot pinggiran, juri dapat terus mendefinisikan jenis kontribusi yang mereka hargai. Mekanisme ini dapat berfungsi sebagai alternatif desentralisasi dan berkelanjutan jangka panjang untuk penambangan, penjualan, atau airdrop sekali jalan.
Peningkatan privasi
Biasanya, untuk membuat penilaian yang benar terhadap masalah dalam contoh di atas, diperlukan akses ke informasi pribadi: catatan obrolan internal organisasi, informasi yang dikirimkan secara rahasia oleh anggota komunitas, dll. Salah satu keuntungan dari 'menggunakan hanya satu AI', terutama dalam lingkungan yang lebih kecil, adalah bahwa memungkinkan satu AI untuk mengakses informasi lebih mudah diterima daripada mempublikasikan informasi kepada semua orang.
Untuk membuat penilaian manusia atau pembiayaan dalam kedua situasi ini berperan, kita dapat mencoba menggunakan teknologi enkripsi untuk memungkinkan AI mengakses informasi pribadi secara aman. Konsep ini melibatkan penggunaan komputasi multipihak (MPC) (, enkripsi homomorfik penuh (FHE) ), lingkungan eksekusi tepercaya (TEE) (, atau mekanisme serupa untuk menyediakan informasi pribadi, tetapi hanya jika output uniknya langsung dimasukkan ke dalam mekanisme 'submit daftar lengkap'.
Jika Anda melakukan hal ini, maka Anda harus membatasi kumpulan mekanisme ke model AI (bukan kombinasi manusia atau AI + manusia, karena Anda tidak bisa membiarkan manusia melihat data), dan khusus untuk dijalankan dalam beberapa basis tertentu (misalnya MPC, FHE, perangkat keras tepercaya) model. Salah satu arah penelitian utama adalah menemukan versi praktis yang cukup efektif dan bermakna dalam waktu dekat.
Keunggulan Desain Mesin + Kemudi
Desain ini memiliki banyak manfaat yang sangat diantisipasi. Sampai saat ini, manfaat terpentingnya adalah bahwa mereka memungkinkan pembangunan DAO, yang memungkinkan pemilih manusia mengendalikan arahnya, tetapi mereka tidak akan terganggu oleh terlalu banyak keputusan. Mereka mencapai keseimbangan, di mana setiap orang tidak perlu membuat N keputusan, tetapi kekuatan yang mereka miliki bukan hanya membuat satu keputusan (biasanya bagaimana delegasi bekerja), tetapi juga dapat memicu preferensi kaya yang sulit untuk diungkapkan secara langsung.
Selain itu, mekanisme ini tampaknya memiliki sifat insentif yang halus. Yang saya maksud dengan 'insentif halus' di sini adalah kombinasi dari dua faktor:
Konfusi dan penyebaran di sini adalah dua istilah yang berasal dari kriptografi, dan keduanya adalah atribut kunci keamanan kriptografi dan fungsi hash.
Sebuah contoh bagus dari insentif yang halus di dunia nyata saat ini adalah hukum: para pejabat pemerintah tidak secara teratur mengambil tindakan dalam bentuk 'berikan 200 juta dolar kepada perusahaan Alice', 'denda perusahaan Bob sebesar 100 juta dolar', tetapi melalui aturan yang dirancang untuk diterapkan secara merata kepada sejumlah besar peserta, kemudian diinterpretasikan oleh jenis peserta lain. Ketika pendekatan ini berhasil, manfaatnya adalah mengurangi secara signifikan suap dan bentuk korupsi lainnya. Ketika dilanggar (yang sering terjadi dalam praktik), masalah-masalah ini dengan cepat membesar.
AI jelas akan menjadi bagian penting di masa depan, ini akan menjadi bagian penting dari tata kelola di masa depan. Namun, jika Anda melibatkan AI dalam tata kelola, ada risiko yang jelas: AI memiliki bias, mungkin sengaja dihancurkan selama proses pelatihan, dan perkembangan teknologi AI begitu cepat sehingga 'membiarkan AI berkuasa' mungkin sebenarnya berarti 'membiarkan orang yang bertanggung jawab atas peningkatan AI berkuasa'. Mengasah penilaian manusia memberikan jalan pengganti yang memungkinkan kita menggunakan kekuatan AI dengan cara pasar bebas terbuka, sambil tetap mempertahankan kendali demokratis manusia.
Terima kasih khusus kepada Devansh Mehta, Davide Crapis, dan Julian Zawistowski untuk umpan balik dan tinjauan mereka, serta diskusi dengan Tina Zhen, Shaw Walters, dan orang lain.