Google phát hành thuật toán TurboQuant: Lượng tử hóa KV cache 3 bit không mất độ chính xác, tốc độ suy luận tăng lên tối đa 8 lần

Tin tức Gate News, ngày 25 tháng 3, Viện Nghiên cứu Google đã công bố thuật toán nén lượng tử TurboQuant, có thể nén bộ đệm KV của mô hình ngôn ngữ lớn xuống còn 3 bit, giảm tiêu thụ bộ nhớ ít nhất 6 lần, không cần huấn luyện hoặc tinh chỉnh, không làm giảm độ chính xác của mô hình. Trong chế độ 4 bit, tốc độ tính toán chú ý trên GPU NVIDIA H100 tăng tối đa 8 lần so với mức cơ sở không nén 32 bit. Nhóm nghiên cứu đã xác nhận hiệu quả của TurboQuant trên các bộ chuẩn dài như LongBench, Needle In A Haystack, ZeroSCROLLS bằng cách sử dụng các mô hình Gemma và Mistral, đạt hiệu suất tối ưu trong tất cả các thử nghiệm. Thuật toán này gồm hai phần: PolarQuant sử dụng biến đổi tọa độ cực để loại bỏ chi phí bộ nhớ của phương pháp lượng tử truyền thống, QJL chỉ dùng 1 bit để hiệu chỉnh sai số còn lại. Nghiên cứu do Amir Zandieh của Viện Nghiên cứu Google và Phó Chủ tịch kiêm Google Fellow Vahab Mirrokni dẫn đầu, hợp tác với KAIST Hàn Quốc và Đại học New York, sẽ được trình bày tại ICLR 2026. Google cho biết một trong những ứng dụng chính của công nghệ này là giải quyết nút thắt về bộ đệm KV của các mô hình như Gemini.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Chuẩn mực gọi vốn Crypto VC Tăng; 2026-2027 được kỳ vọng là giai đoạn đầu tư mạnh nhất kể từ năm 2018

Bối cảnh đầu tư mạo hiểm tiền mã hóa đang chuyển dịch: các nhà đầu tư hiện yêu cầu có sẵn lượng người dùng thực chứng và doanh thu trước khi rót vốn. Sự hấp dẫn của các mô hình token đang suy giảm, trong khi mảng AI thu hút nguồn lực. Tuy nhiên, các điều kiện được cải thiện có thể thúc đẩy đầu tư vào stablecoin và hạ tầng tài chính trong giai đoạn 2026-2027.

GateNews32phút trước

Khảo sát nhà đầu tư tổ chức của Nomura: 65% coi tài sản mã hóa là cấu phần phân bổ quan trọng để đa dạng hóa, gần 80% dự kiến sẽ tham gia trong vòng ba năm tới

Theo khảo sát của Nomura Holdings và Laser Digital, 65% nhà đầu tư tổ chức tại Nhật Bản coi tài sản mã hóa là một công cụ quan trọng để đa dạng hóa danh mục, cho thấy sự quan tâm đến mức độ tương quan thấp của chúng. Gần 80% người được hỏi dự định phân bổ 2%-5% tài sản vào tiền mã hóa trong ba năm tới, đồng thời cho thấy sự quan tâm cao đối với nhiều chủ đề chi tiết như staking (ủy thác), cho vay và đi vay. Việc cải thiện môi trường quản lý tại Nhật Bản đã thúc đẩy xu hướng này, nhưng vẫn tồn tại các trở ngại như vấn đề thuế và kiểm soát rủi ro nội bộ.

ChainNewsAbmedia13giờ trước

AI 吞噬全球创投 80%,Q1 2026 吸走 2,420 亿美元:Crypto 业者如何因应资金重分配

Theo báo cáo, tổng vốn đầu tư mạo hiểm toàn cầu trong quý 1 năm 2026 gần đạt 300 tỷ đô la Mỹ, trong đó các công ty liên quan đến AI chiếm riêng khoảng 242 tỷ đô la Mỹ, tương đương 80% vốn đầu tư mạo hiểm. Điều này cho thấy AI đã trở thành trọng tâm chính của đầu tư mạo hiểm. Khi dòng vốn tập trung vào AI, các lĩnh vực khác như crypto bị chèn ép, các doanh nghiệp cần điều chỉnh chiến lược, tích hợp sâu hơn AI vào hoạt động kinh doanh của mình, và dự kiến sẽ xuất hiện xu hướng hợp nhất cơ sở hạ tầng.

ChainNewsAbmedia17giờ trước

Khảo sát của Nomura: 80% nhà đầu tư tổ chức dự định phân bổ 2% đến 5% AUM vào tài sản mã hóa

Khảo sát nhà đầu tư tổ chức tài sản kỹ thuật số năm 2026 của Nomura Securities (Nomura) và công ty con tiền mã hóa Laser Digital cho thấy, gần bốn trên năm nhà đầu tư tổ chức được phỏng vấn dự định phân bổ 2% đến 5% tổng tài sản được quản lý (AUM) của họ vào thị trường tiền mã hóa; đa số tổ chức cho biết kế hoạch thực hiện trong vòng một năm tới, thay vì đầu tư ngay lập tức.

MarketWhisper04-17 03:05

Khảo sát của Nomura: 80% Nhà đầu tư Tổ chức Sẵn sàng Phân bổ 2-5% cho Tiền mã hóa

Khảo sát của Nomura cho thấy 80% nhà đầu tư tổ chức đặt mục tiêu phân bổ 2-5% vào tiền mã hóa, ưu tiên các chiến lược tạo lợi nhuận như staking và cho vay. Tính rõ ràng về quy định và quản lý rủi ro là những yếu tố then chốt để thúc đẩy sự quan tâm của các nhà đầu tư tổ chức đối với tài sản kỹ thuật số.

GateNews04-16 19:11
Bình luận
0/400
Không có bình luận