การตรวจสอบ AI เข้าสู่การปฏิบัติจริง OpenAI เปิดตัว EVMbench เสริมความแข็งแกร่งในการประเมินความปลอดภัยของสมาร์ทคอนแทรกต์

ETH-0.76%
WELL-5.01%

OpenAI ร่วมมือกับ Paradigm เปิดตัว EVMbench ทดสอบความสามารถในการโจมตีและป้องกันสัญญาอัจฉริยะบน EVM เผยความกังวลเกี่ยวกับจุดอ่อนและความแข็งแกร่งของการโจมตี

เน้นการทดสอบในสภาพแวดล้อมทางเศรษฐกิจ OpenAI ร่วมกับ Paradigm เสริมความปลอดภัยบนบล็อกเชน

ผู้นำด้านปัญญาประดิษฐ์ OpenAI ประกาศความร่วมมือกับบริษัทลงทุนในคริปโตเคอเรนซีชื่อดัง Paradigm และบริษัทด้านความปลอดภัย OtterSec เปิดตัวเครื่องมือทดสอบมาตรฐาน EVMbench ซึ่งออกแบบมาเพื่อประเมินประสิทธิภาพของ AI ตัวแทน (AI Agents) ในด้านความปลอดภัยของสัญญาอัจฉริยะบน Ethereum Virtual Machine (EVM)

ด้วยการบูรณาการอย่างลึกซึ้งระหว่าง AI กับเทคโนโลยีคริปโต สัญญาอัจฉริยะกลายเป็นโครงสร้างพื้นฐานสำคัญในการจัดการสินทรัพย์คริปโตเปิดจำนวนมากกว่า 1,000 พันล้านดอลลาร์ การเปิดตัวเครื่องมือนี้เป็นสัญญาณว่าอุตสาหกรรมเริ่มให้ความสนใจต่อความสามารถของ AI ในสภาพแวดล้อมที่มีความหมายทางเศรษฐกิจ

ทีมงาน OpenAI ชี้ว่า ด้วยความก้าวหน้าของ AI ตัวแทนในด้านการเขียนและวางแผนโค้ด ในอนาคตโมเดลเหล่านี้จะมีบทบาทเปลี่ยนแปลงทั้งด้านการโจมตีและการป้องกันบนบล็อกเชน ดังนั้น การสร้างมาตรฐานการประเมินผลจึงเป็นสิ่งสำคัญในการติดตามความก้าวหน้าของ AI

การทดสอบเชิงลึกใน 3 โหมด พร้อม 120 ช่องโหว่จากการตรวจสอบจริงกลายเป็นเกณฑ์วัดความสามารถของ AI

การออกแบบหลักของ EVMbench มุ่งเน้นไปที่การทดสอบ 120 ช่องโหว่ที่สกัดจากรายงานการตรวจสอบเชิงมืออาชีพจำนวน 40 รายการ ซึ่งข้อมูลมาจากการแข่งขันการตรวจสอบสาธารณะ เช่น Code4rena เพื่อให้แน่ใจว่าสภาพแวดล้อมการทดสอบใกล้เคียงกับความซับซ้อนในโลกจริง เครื่องมือนี้จะประเมิน AI ตัวแทนในสามโหมดการทำงาน:

ภาพประกอบ: การออกแบบหลักของ EVMbench ของ OpenAI คือการประเมิน AI ตัวแทนในสามโหมดการทำงาน

  • โหมดแรกคือ “ตรวจจับ (Detect)” ซึ่งให้ AI ตรวจสอบโค้ดสัญญาอัจฉริยะและระบุช่องโหว่ที่รู้จัก พร้อมให้คะแนนตามระดับความรุนแรงของปัญหา
  • โหมดที่สองคือ “แก้ไข (Patch)” ซึ่งท้าทาย AI ให้ลบช่องโหว่ที่สามารถโจมตีได้และแก้ไขโค้ดโดยไม่กระทบต่อฟังก์ชันเดิม
  • โหมดสุดท้ายคือ “ใช้ประโยชน์ (Exploit)” ซึ่งเป็นโหมดที่ถกเถียงกันมาก AI ต้องดำเนินการโจมตีขโมยเงินในสภาพแวดล้อม sandbox ของบล็อกเชนแบบ end-to-end

เพื่อความแน่นอนและความสามารถในการทำซ้ำ ทีมงานได้พัฒนาสถาปัตยกรรมการทดสอบบนภาษา Rust โดยใช้เทคนิคการเล่นธุรกรรมที่เป็นเอกลักษณ์เพื่อยืนยันว่าการโจมตีหรือการแก้ไขของ AI สำเร็จหรือไม่

แนวโน้มการโจมตีและการป้องกันชัดเจน GPT-5.3-Codex แสดงอัตราการเติบโตของการโจมตีที่น่าทึ่ง

ผลการทดสอบเบื้องต้นแสดงให้เห็นว่า AI มีความสามารถแตกต่างกันอย่างชัดเจนในแต่ละภารกิจ โดย GPT-5.3-Codex รุ่นล่าสุด ทำผลงานได้ดีในโหมดใช้ประโยชน์ (Exploit Mode) ด้วยคะแนนสูงถึง 72.2% ซึ่งสูงกว่ารุ่น GPT-5 ที่เปิดตัวเมื่อหกเดือนก่อนซึ่งได้เพียง 31.9% อย่างมาก

ภาพประกอบ: สรุปคะแนนของโมเดล AI ต่าง ๆ ของ OpenAI ในสามโหมด

สิ่งนี้แสดงให้เห็นว่า เมื่อเป้าหมายชัดเจนว่า “ขโมยเงิน” AI มีความสามารถในการวางแผนและดำเนินการอย่างมีประสิทธิภาพ อย่างไรก็ตาม ผลด้านการป้องกันกลับค่อนข้างอ่อนแอ AI มักจะหยุดการค้นหาเมื่อพบข้อผิดพลาดเพียงจุดเดียว และเมื่อแก้ไขความซับซ้อนของตรรกะ ก็ยังพบว่ามีความยากในการซ่อมแซมช่องโหว่โดยไม่ส่งผลกระทบต่อการทำงานของสัญญาอย่างสมบูรณ์ ผู้เชี่ยวชาญด้านความปลอดภัยแสดงความกังวลว่า AI อาจลดเวลาที่ใช้ในการค้นหาช่องโหว่และพัฒนาวิธีโจมตีลงอย่างมาก ซึ่งเป็นความท้าทายต่อความเร็วในการป้องกันของโปรเจกต์ DeFi

การรับสมัครบุคลากรและการสนับสนุนด้านการป้องกัน OpenAI วางแผนสร้างความปลอดภัยในระบบนิเวศ AI ตัวแทน

นอกจากการพัฒนาเครื่องมือแล้ว OpenAI ยังเน้นการวางกลยุทธ์ด้านบุคลากรและการป้องกันในระบบนิเวศ โดยล่าสุดได้ว่าจ้าง Peter Steinberger ผู้ก่อตั้งโครงการ AI ตัวแทนโอเพนซอร์ส OpenClaw เพื่อเป็นผู้นำในการพัฒนาตัวแทนส่วนบุคคลรุ่นใหม่ และเปลี่ยนโครงการนี้เป็นโมเดลกองทุนสนับสนุนโดย OpenAI

เพื่อรับมือกับความเสี่ยงด้านความปลอดภัยทางไซเบอร์ที่อาจเกิดจาก AI OpenAI สัญญาว่าจะใช้เงินสนับสนุน 10 ล้านดอลลาร์จากโครงการสนับสนุนด้านความปลอดภัยทางไซเบอร์ เพื่อสนับสนุนเครื่องมือป้องกันโอเพนซอร์สและการวิจัยโครงสร้างพื้นฐานสำคัญ เหตุการณ์นี้มีความสำคัญอย่างยิ่งหลังจากเหตุการณ์ในโปรโตคอล Moonwell ซึ่งเกิดความผิดพลาดในการคำนวณราคาด้วย AI ส่งผลให้เกิดความเสียหายประมาณ 1.78 ล้านดอลลาร์

อ่านเพิ่มเติม
ปฏิเสธข้อเสนอจาก Meta มูลค่าหลายพันล้านดอลลาร์ ผู้สร้าง OpenClaw เข้าร่วมชิงตำแหน่งใน OpenAI กระแสแรง? การคาดการณ์ของ Moonwell เกิดข้อผิดพลาด ทำให้เสียหาย 1.78 ล้านดอลลาร์ ใครจะรับผิดชอบ?

ในอนาคต เมื่อมีการเพิ่มตัวแทนชำระเงินแบบอัตโนมัติและกระเป๋าเงินอัจฉริยะที่ใช้ AI เข้าสู่ระบบนิเวศมากขึ้น การใช้เครื่องมือเช่น EVMbench เพื่อแยกแยะโมเดลที่สามารถอธิบายช่องโหว่ได้เพียงอย่างเดียว กับโมเดลที่สามารถให้แนวทางป้องกันที่เชื่อถือได้ จะกลายเป็นจุดเปลี่ยนสำคัญในอุตสาหกรรมความปลอดภัยของบล็อกเชน

ดูต้นฉบับ
news.article.disclaimer

btc.bar.articles

Doodles เปิดตัวเครื่องมือสร้างสรรค์ AI makedoodles.ai

ข่าว Gate News เมื่อวันที่ 18 มีนาคม โครงการ NFT ชื่อ Doodles ได้เปิดตัวแพลตฟอร์มการสร้างสรรค์ AI ที่ชื่อ makedoodles.ai แพลตฟอร์มนี้รองรับการอัปโหลดรูปภาพของผู้ใช้ และสร้างงานศิลปะในรูปแบบ Doodles ผ่านเทคโนโลยี AI

GateNews9 นาที ที่แล้ว

Circle แต่งตั้ง Kirk Koenigsbauer ผู้บริหารไมโครซอฟต์เข้าคณะกรรมการ เพื่อเสริมความแข็งแกร่งในการบริหารความเสี่ยง

Circle ประกาศแต่งตั้ง Kirk Koenigsbauer ผู้บริหารจาก Microsoft เป็นสมาชิกคณะกรรมการ เพื่อเสริมความสามารถในการกำกับดูแลและบริหารจัดการความเสี่ยง พื้นฐานด้าน Microsoft ของ Koenigsbauer จะช่วย Circle ในการรับมือกับความท้าทายด้านการปฏิบัติตามข้อบังคับและความปลอดภัยในขณะที่บริษัทเปลี่ยนผ่านจากบริษัทสตาร์ทอัปไปยังบริษัทจดทะเบียนที่มีความชำนัญ และยังเพิ่มความเชื่อมั่นของตลาดในเรื่อง USDC พร้อมขยายขีดความสามารถในการเข้าถึงบริษัทของภาคเอกชน

MarketWhisper13 นาที ที่แล้ว

Tether เปิดตัวกรอบการฝึกอบรม AI สำหรับสมาร์ทโฟนและ GPU ผู้บริโภค

Tether ได้เปิดตัวกรอบการฝึกอบรม AI ใหม่ที่ช่วยให้สามารถปรับแต่งโมเดลภาษาขนาดใหญ่บนอุปกรณ์ผู้บริโภค เช่น สมาร์ทโฟนและ GPU ที่ไม่ใช่ Nvidia ได้ โดยใช้สถาปัตยกรรม BitNet ของ Microsoft และเทคนิค LoRA ช่วยลดต้นทุนหน่วยความจำและการคำนวณอย่างมีนัยสำคัญ และรองรับชิปเซตต่างๆ ความก้าวหน้านี้สอดคล้องกับแนวโน้มของบริษัทสกุลเงินดิจิทัลที่ขยายตัวเข้าสู่ด้าน AI และโครงสร้างพื้นฐานการคำนวณ

TapChiBitcoin17 นาที ที่แล้ว

Aster เปิดตัว mainnet Aster Chain: 100,000 TPS, zero gas, ความปลอดภัยแบบค่าเริ่มต้น

Aster ซึ่งเป็น DEX สำหรับสินค้าอนุพันธ์ที่ได้รับการสนับสนุนจากสำนักงานครอบครัวของ Changpeng Zhao ได้เปิดตัว mainnet ของตนด้วย blockchain Layer 1 ส่วนตัว โดยมีเป้าหมายในการปรับปรุงความโปร่งใสของ DeFi พร้อมทั้งเพิ่มประสิทธิภาพการทำงานและธุรกรรมส่วนตัว โดยใช้ประโยชน์จากเทคโนโลยี zero-knowledge

TapChiBitcoin23 นาที ที่แล้ว

เครื่องมือการกำกับดูแล Ethereum ชื่อ Tally หยุดให้บริการ, Uniswap และ Arbitrum ค้นหาแนวทางทดแทนใหม่

เครื่องมือการกำกับดูแลการเข้ารหัส Tally ประกาศปิดตัวในวันที่ 17 มีนาคม หลังจากดำเนินการมานานกว่า 5 ปี Tally เคยให้บริการโครงสร้างพื้นฐานการกำกับดูแลสำหรับโปรโตคอลอีเธอรีมหลายตัว โดยจัดการการทำธุรกรรมกว่า 10 ล้านเหรียญ เหตุผลในการปิดตัวรวมถึงระยะเวลาของตลาดที่ไม่เหมาะสมและความล้มเหลวในการปฏิบัติตามคำสัญญาเกี่ยวกับโทเคน ซึ่งสะท้อนถึงความยากลำบากในการสร้างรายได้จากเครื่องมือการกำกับดูแล DAO แม้ว่าจะเผชิญกับความท้าทาย แนวคิด DAO ยังคงพัฒนาต่อไป โดยอาจมุ่งไปสู่การสร้างโครงสร้างพื้นฐานที่หลากหลายในอนาคต

MarketWhisper29 นาที ที่แล้ว

Ethereum Foundation เปิดตัวโปรแกรมทุนวิจัย 24,000 USD สำหรับนักวิจัยระดับปริญญาเอก

Ethereum Foundation เปิดตัวโปรแกรมทุนการศึกษาเพื่อสนับสนุนการวิจัยระดับปริญญาเอก (PhD) เกี่ยวกับ Ethereum โดยมีเงินอุดหนุน $24,000 สำหรับการศึกษาเป็นระยะเวลา 1 ปี เปิดให้สมัครจากทุกสาขาวิชา แต่มีการให้ความสำคัญกับเศรษฐศาสตร์ วิทยาศาสตร์การเมือง และอื่นๆ และจะคัดเลือก 9-10 ผู้สมัครที่ประสบความสำเร็จ ระยะเวลาสำหรับการสมัครสิ้นสุดในวันที่ 1 เมษายน

TapChiBitcoin32 นาที ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น