Google phát hành mô hình mở thông minh nhất Gemma 4! Toàn diện chuyển sang giấy phép Apache 2.0, hiệu năng sánh ngang với các AI lớn mã nguồn đóng

動區BlockTempo

2026-04-03 02:00:42

Google chính thức công bố ra mắt thế hệ mô hình mở mới Gemma 4. Mô hình này sử dụng cùng kiến trúc kỹ thuật như Gemini 3, chuyển toàn diện sang giấy phép Apache 2.0 thân thiện với doanh nghiệp, đồng thời nhấn mạnh khả năng chạy tại chỗ mạnh mẽ.
（Tóm tắt: Máy tính lượng tử của Google được cho là đã phá mã Bitcoin trong 9 phút; số liệu được tính như thế nào, và mối đe dọa thực sự nằm ở đâu?）
（Bổ sung bối cảnh: Dự báo thiên tai bằng AI》Google ra mắt khung “Groundsource”, dùng Gemini để chuyển tin tức toàn cầu thành 2,6 triệu dữ liệu cứu mạng）

Mục lục bài viết

Chuyển đổi

Ra mắt đồng loạt bốn phiên bản, chạy mượt ngay cả tại chỗ
Hỗ trợ cửa sổ 256K, đa phương thức nguyên sinh và gọi hàm
Hiệu năng áp sát “quái vật” khổng lồ, đánh giá cộng đồng nổi bật

Google một lần nữa tung ra đòn “đánh mạnh” vào lĩnh vực AI mã nguồn mở. Thông báo mới nhất của hãng cho biết đã cho ra mắt loạt “Gemma 4”, được quảng bá là mô hình mở thông minh nhất hiện nay trong hệ sinh thái của họ. Gemma 4 kế thừa trực tiếp công nghệ nghiên cứu đẳng cấp thế giới của mô hình chủ lực Gemini 3, mang lại khả năng suy luận mang tính đột phá và quy trình làm việc kiểu tác nhân (Agentic). Điều khiến cộng đồng đặc biệt chú ý là Google lần này đã đáp ứng tiếng gọi của nhà phát triển, chuyển toàn diện sang giấy phép Apache 2.0 thân thiện với thương mại, giúp người dùng có thể tự do xây dựng và triển khai an toàn trong mọi môi trường, hoàn toàn kiểm soát dữ liệu và hạ tầng của chính mình.

Chúng tôi vừa phát hành Gemma 4 — các mô hình mở thông minh nhất của chúng tôi cho đến nay.

Được xây dựng từ cùng nền nghiên cứu đẳng cấp thế giới như Gemini 3, Gemma 4 mang trí tuệ đột phá trực tiếp đến phần cứng của bạn để phục vụ suy luận nâng cao và các tác vụ theo quy trình tác nhân.

Phát hành theo… pic.twitter.com/W6Tvj9CuHW

— Google (@Google) ngày 2 tháng 4 năm 2026

Ra mắt đồng loạt bốn phiên bản, chạy mượt ngay cả tại chỗ

Để đáp ứng các nhu cầu phần cứng và tình huống ứng dụng khác nhau, Gemma 4 có tổng cộng bốn phiên bản với quy mô khác nhau. Phiên bản nhẹ nhất E2B (2B tham số) được thiết kế riêng cho thiết bị di động và các thiết bị biên như trình duyệt; E4B (4B tham số) cân bằng giữa hiệu năng và hiệu suất, đồng thời hỗ trợ đầu vào hình ảnh và âm thanh một cách “nguyên sinh” hơn. Ở phía hiệu năng cao, A4B 26B sử dụng kiến trúc chuyên gia lai (MoE), khi suy luận chỉ kích hoạt khoảng 4B tham số, giúp giảm đáng kể nhu cầu bộ nhớ, dù chạy trên phần cứng tiêu dùng như Mac Mini với 24GB bộ nhớ vẫn có thể hoạt động mượt mà. Phiên bản mật độ cao 31B là “lá cờ hiệu năng” của cả dòng.

Hỗ trợ cửa sổ 256K, đa phương thức nguyên sinh và gọi hàm

Về thông số kỹ thuật, phiên bản mô hình lớn của Gemma 4 tối đa hỗ trợ cửa sổ ngữ cảnh lên tới 256K tokens, cho phép nhà phát triển xử lý một lần toàn bộ kho mã nguồn hoặc lượng dữ liệu tài liệu khổng lồ. Ngoài việc hỗ trợ nguyên sinh xử lý văn bản và hình ảnh (E2B và E4B cũng hỗ trợ âm thanh), Gemma 4 còn có khả năng gọi hàm (Function Calling) nguyên sinh mạnh mẽ, có thể xuất ổn định định dạng JSON dạng cấu trúc, tạo nền tảng tuyệt vời để xây dựng các ứng dụng tác nhân tự chủ. Ngoài ra, dữ liệu huấn luyện của nó bao gồm hơn 140 ngôn ngữ, có tính ứng dụng toàn cầu cao.

Hiệu năng áp sát “quái vật” khổng lồ, đánh giá cộng đồng nổi bật

Gemma 4 nhấn mạnh hiệu năng theo “mỗi byte” ở mức cực cao. Theo dữ liệu từ các bảng xếp hạng mô hình mở như AI Arena, Gemma-4-31B hiện đang đứng thứ 3 trong nhóm mô hình mở; nhìn chung, hiệu suất của nó thậm chí tương đương với Qwen3.5-397B có kích thước rất lớn, nhưng quy mô của nó chỉ bằng một phần mười của mô hình sau. Ở các bài kiểm tra chuẩn suy luận bậc “nghiên cứu sinh” (GPQA Diamond), phiên bản 31B còn đạt thành tích 84,3% đáng kinh ngạc.

Hãy xem mô hình mở Gemma đã tiến bộ như thế nào qua ba phiên bản gần đây nhất của nó.
– Gemma 4 xếp hạng cao hơn Gemma 3 tới 100 bậc
– Gemma 3 cao hơn Gemma 2 tới 87 bậc

Cả ba mô hình từ @GoogleDeepMind đều có kích thước xấp xỉ nhau (31B, 27B, 27B), và các mức cải tiến này chỉ đến từ 9 và 13… https://t.co/9JnbveYzwT pic.twitter.com/JQtTz09Y1A

— Arena.ai (@arena) ngày 2 tháng 4 năm 2026

Hiện tại, nhà phát triển đã có thể trực tiếp trải nghiệm Gemma 4 trên Google AI Studio, hoặc đến các nền tảng như Hugging Face, Ollama để tải các mô hình trọng số. Cộng đồng cũng nhanh chóng hưởng ứng, cho ra mắt các phiên bản lượng tử hóa được tối ưu cho GPU. Tuy nhiên, vẫn có một số nhà phát triển cho rằng, khi đối mặt với các môi trường gỡ lỗi mã nguồn phức tạp trong thế giới thực, Gemma 4 vẫn còn không gian để tối ưu. Dù vậy, nhìn chung, việc phát hành mã nguồn mở lần này không nghi ngờ gì nữa đã rót thêm một “liều trợ lực” cho mục tiêu thúc đẩy chủ quyền số và ứng dụng AI chạy tại chỗ.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bình luận

0/400

Không có bình luận