Ramp Labs เสนอแนวทางใหม่สำหรับการแชร์หน่วยความจำแบบหลายเอเจนต์ โดยการใช้โทเคนสูงสุดลดลง 65%

GateNews

ข่าว Gate News วันที่ 11 เมษายน บริษัทโครงสร้างพื้นฐานด้าน AI Ramp Labs เปิดเผยผลการวิจัย “Latent Briefing” โดยบีบอัดแคช KV ของโมเดลขนาดใหญ่โดยตรงเพื่อทำให้เกิดการแชร์ความจำอย่างมีประสิทธิภาพระหว่างระบบหลายเอเจนต์ (multi-agent) ภายใต้เงื่อนไขที่ไม่ทำให้ความแม่นยกลดลง และลดการใช้ Token ได้อย่างมาก ในสถาปัตยกรรมหลายเอเจนต์ที่เป็นกระแสหลัก ผู้ประสานงาน (Orchestrator)จะแยกงานออกและเรียกใช้โมเดลผู้ปฏิบัติงาน (Worker)ซ้ำ ๆ เมื่อระยะเส้นทางการอนุมาน (inference) ยาวขึ้น ปริมาณ Token ก็จะเพิ่มขึ้นแบบทวีคูณ Latent Briefing มีแนวคิดหลักคือใช้กลไกความสนใจ (attention) เพื่อระบุส่วนที่สำคัญจริง ๆ ในบริบท จากนั้นจึงทิ้งข้อมูลที่ซ้ำซ้อนทันทีในชั้นการแทนค่า (representation) ไม่ใช่พึ่งพาสรุปด้วย LLM ที่ช้ากว่า หรือการค้นคืน RAG ที่เสถียรภาพต่ำ ในการทดสอบเกณฑ์มาตรฐาน LongBench v2 วิธีนี้ทำผลงานได้เด่น: การใช้ Token ของโมเดล Worker ลดลง 65% การประหยัด Token สำหรับเอกสารความยาวปานกลาง (32k ถึง 100k) มีค่ามัธยฐานอยู่ที่ 49% ความแม่นยำโดยรวมสูงขึ้นประมาณ 3 จุดเปอร์เซ็นต์เมื่อเทียบกับฐาน (baseline) และเวลาเพิ่มเติมที่ใช้สำหรับการบีบอัดแต่ละครั้งอยู่ที่ราว 1.7 วินาทีเท่านั้น ทำให้เร็วขึ้นประมาณ 20 เท่าจากอัลกอริทึมเดิม การทดลองใช้ Claude Sonnet 4 เป็นผู้ประสานงาน และ Qwen3-14B เป็นโมเดลผู้ปฏิบัติงาน ครอบคลุมสถานการณ์เอกสารหลายประเภท เช่น บทความวิชาการ เอกสารทางกฎหมาย นวนิยาย และรายงานของรัฐบาล งานวิจัยยังพบว่า “ขีดจำกัดการบีบอัดที่เหมาะสมที่สุด” จะแตกต่างกันตามความยากของงานและความยาวของเอกสาร—งานที่ยากเหมาะกับการบีบอัดแบบก้าวร้าวเพื่อกรองสัญญาณรบกวนจากการอนุมานเชิงคาดเดา (speculative) ขณะที่เอกสารยาวเหมาะกับการบีบอัดแบบเบาเพื่อคงรักษาข้อมูลสำคัญที่กระจายอยู่

news.article.disclaimer

btc.bar.articles

สหรัฐอาหรับเอมิเรตส์ประกาศการเปลี่ยนผ่านสู่โมเดลรัฐบาลที่ขับเคลื่อนด้วย AI ภายในสองปีข้างหน้า

สมเด็จพระอาตะหก ชีค โมฮัมเหม็ด บิน ราชิด อัล มักตูม ได้กล่าวว่า เป้าหมายคือให้ภาคส่วนของรัฐบาล 50% ดำเนินการผ่าน AI แบบเอเจนต์อัตโนมัติ การเปลี่ยนผ่านดังกล่าวจะรวมถึงการฝึกอบรมพนักงานระดับสหพันธรัฐให้ “เชี่ยวชาญ AI” และจะอยู่ภายใต้การกำกับดูแลของชีค มันซูร์ บิน ซาเยด หัวข้อสำคัญ:

Coinpedia15 ชั่วโมง ที่แล้ว

แพลตฟอร์มเทรดด้วย AI อย่าง Fere AI ระดมทุนได้ 1.3 ล้านดอลลาร์ นำโดย Ethereal Ventures

ข้อความจาก Gate News ประจำวันที่ 25 เมษายน — Fere AI ซึ่งเป็นแพลตฟอร์มการเทรดสินทรัพย์ดิจิทัลที่ขับเคลื่อนด้วย AI ประกาศเสร็จสิ้นการระดมทุนมูลค่า 1.3 ล้านดอลลาร์ ซึ่งนำโดย Ethereal Ventures โดยมี Galaxy Vision Hill และ Kosmos Ventures เข้าร่วม ตามข้อมูลจาก Globenewswire แพลตฟอร์มรองรับเครือข่ายข้ามสายโซ่

GateNews16 ชั่วโมง ที่แล้ว

Nvidia ปรับใช้เอเจนต์ AI Codex ของ OpenAI ทั่วทั้งองค์กรบนโครงสร้างพื้นฐาน Blackwell

ข่าวประจำ Gate วันที่ 25 เมษายน — Nvidia ได้เปิดตัว Codex ของ OpenAI ซึ่งเป็นเอเจนต์ AI ที่ขับเคลื่อนด้วย GPT-5.5 ให้กับพนักงานทั้งหมดทั่วทั้งองค์กร หลังจากการทดสอบที่ประสบความสำเร็จกับพนักงานราว 10,000 คน ตามรายงานการสื่อสารภายในจากซีอีโอ Jensen Huang และ CEO ของ OpenAI Sam Altman. Codex ถูกออกแบบมาเพื่อช่วยใน

GateNews21 ชั่วโมง ที่แล้ว

สตาร์ทอัพเขียนโค้ดด้วย AI Cognition อยู่ระหว่างการเจรจาเพื่อการระดมทุนที่ $25B Valuation

ข้อความจาก Gate News วันที่ 25 เมษายน — สตาร์ทอัพด้านการเขียนโค้ดด้วย AI อย่าง Cognition กำลังอยู่ระหว่างการคุยระยะแรกเพื่อระดมทุนหลายร้อยล้านดอลลาร์หรือมากกว่า ที่มูลค่าโดยประมาณ $25 พันล้านดอลลาร์ ตามข้อมูลจากผู้ที่มีความเกี่ยวข้องกับเรื่องนี้ ความสนใจเพิ่มขึ้นหลังจาก SpaceX เข้าซื้อสตาร์ทอัพด้านการเขียนโค้ดด้วย AI ที่เป็นคู่แข่ง Co

GateNews21 ชั่วโมง ที่แล้ว

แพลตฟอร์มเอเจนต์เทรดแบบใช้ AI อย่าง Fere AI ระดมทุนได้ 1.3 ล้านดอลลาร์ นำโดย Ethereal Ventures

ข้อความจาก Gate News วันที่ 25 เมษายน — แพลตฟอร์มเอเจนต์การเทรดสินทรัพย์ดิจิทัลที่ขับเคลื่อนด้วย AI อย่าง Fere AI ประกาศเสร็จสิ้นการระดมทุนมูลค่า 1.3 ล้านดอลลาร์ นำโดย Ethereal Ventures โดยมี Galaxy Vision Hill และ Kosmos Ventures เข้าร่วมด้วย แพลตฟอร์มรองรับเครือข่ายข้ามสายโซ่รวมถึง Ethereum,

GateNews22 ชั่วโมง ที่แล้ว

OpenClaw v2026.4.23 เพิ่มการรองรับ OAuth โดยตรงสำหรับ gpt-image-2 และแนะนำโหมดคอนเท็กซ์ที่แยกจากกันสำหรับซับเอเจนต์

ข่าว Gate,25 เมษายน — OpenClaw ซึ่งเป็นเฟรมเวิร์กเอเจนต์ AI แบบโอเพนซอร์ส เปิดตัว v2026.4.23 เมื่อวันที่ 23 เมษายน โดยนำเสนอการอัปเดตในด้านการสร้างภาพ กลไกซับเอเจนต์ และการเสริมความปลอดภัยอย่างเข้มงวด การปรับปรุงการสร้างภาพช่วยให้ gpt-image-2 สามารถเรียกใช้งานได้โดยตรงผ่าน Codex OAuth โดยไม่ต้อง

GateNews23 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น