2026-04-01 05:01:59

#ClaudeCode500KCodeLeak – Câu chuyện đầy đủ: Làm thế nào Anthropic vô tình mở mã nguồn 512.000 dòng của AI Coding Agent quý giá nhất của họ (Và Tại sao điều này thay đổi mọi thứ)

Bạn bè, nhà phát triển, người theo dõi AI, và bất cứ ai đã sử dụng Claude Code hàng ngày – hãy chuẩn bị sẵn sàng. Những gì xảy ra vào ngày 31 tháng 3 năm 2026 không chỉ là một “sự cố nhỏ” trong công nghệ. Đây là một trong những vụ rò rỉ mã nguồn vô tình lớn nhất trong lịch sử AI. Anthropic, công ty đứng sau Claude, đã vô tình để lộ gần như TOÀN BỘ mã nguồn của sản phẩm chủ lực Claude Code – khoảng 500.000 đến 512.000 dòng mã sạch, dễ đọc bằng TypeScript, trong khoảng 1.900–1.906 tệp.
Không hack. Không vi phạm bởi nhóm bí ẩn nào đó. Chỉ là lỗi con người trong một sai sót đóng gói npm khiến mọi thứ bị lộ qua một tệp bản đồ mã nguồn khổng lồ 59.8 MB. Và đúng vậy, nó đã được sao chép trên GitHub, được hàng nghìn lượt sao, phân nhánh điên cuồng, và phân tích bởi các nhà phát triển trên toàn thế giới chỉ trong vài giờ.
Claude Code là gì?
Đối với những ai chưa biết: Claude Code không chỉ là một lớp wrapper CLI khác hoặc giao diện chatbot đơn giản. Đó là nền tảng AI lập trình có khả năng toàn diện của Anthropic – một hệ thống chạy thời gian phức tạp hỗ trợ các agent lập trình tự động. Nghĩa là có bộ nhớ liên tục, các sub-agent nền, logic điều phối, tích hợp công cụ, lệnh slash, và một hệ sinh thái ẩn giúp Claude cảm thấy “sống động” khi bạn xây dựng các dự án lớn.
Đây là sản phẩm tạo ra doanh thu ước tính 2,5 tỷ USD mỗi năm, trong đó 80% đến từ khách hàng doanh nghiệp dựa vào nó cho công việc phát triển nghiêm túc. Đây không phải mã chơi chơi. Đây là hạ tầng tiêu chuẩn sản xuất phục vụ cả người dùng công cộng và các nhóm nội bộ của Anthropic (thư viện mã còn có cờ USER_TYPE === "ant" để phân biệt các bản build nội bộ).
Làm thế nào vụ rò rỉ xảy ra (Cách ngu ngốc nhất có thể)
Phiên bản 2.1.88 của gói npm chính thức @anthropic-ai/claude-code đã được phát hành. Bên trong đó? Một tệp bản đồ mã nguồn mà KHÔNG BAO GIỜ nên xuất hiện trong môi trường sản xuất. Bản đồ mã nguồn là công cụ gỡ lỗi – chúng ánh xạ mã JS đã nén về TypeScript gốc để nhà phát triển dễ debug hơn. Nhưng cái này nặng 59.8 MB và chứa toàn bộ mã nguồn chưa nén, chưa che giấu của toàn bộ ứng dụng.
Nhà nghiên cứu bảo mật Chaofan Shou (khen ngợi huyền thoại) đã phát hiện ra đầu tiên, chia sẻ liên kết, và internet đã làm những gì nó làm tốt nhất. Trong vòng vài phút, mã đã được tải xuống, giải nén, sao chép, và phân tích. Anthropic nhanh chóng gỡ bỏ phiên bản v2.1.88 và quay lại v2.1.87, nhưng thiệt hại đã xảy ra. Con mèo (hoặc có thể nói là con Capybara – sẽ nói rõ hơn sau) đã lộ ra ngoài.
Những gì thực sự bị lộ? (Chi tiết hấp dẫn)
Không chỉ là “một số tệp tin.” Các nhà phân tích và các kỹ sư đảo ngược đã đào sâu đều gọi đây là một mỏ vàng. Dưới đây là những gì bên trong:
Kiến trúc toàn bộ agent: Cách các sub-agent nền hoạt động, cách chúng trích xuất và lưu trữ thông tin quan trọng từ các cuộc trò chuyện dài, và cách chúng đưa thông tin trở lại một cách thông minh để tránh mất ngữ cảnh.
Hệ thống bộ nhớ: Kiến trúc bộ nhớ phân lớp, quản lý trạng thái liên tục, và logic chính xác giúp Claude Code không bị ảo giác hoặc quên trong các phiên lập trình marathon.
Logic điều phối: Toàn bộ “khung dây agentic” – cách các công cụ, daemon, và các quá trình tự động phối hợp mà không xung đột nhau.
44+ cờ tính năng ẩn/không phát hành: Những thứ chưa từng được phát hành ra công chúng nhưng đã được mã hóa đầy đủ và sẵn sàng.
85 lệnh slash và hơn 40 công cụ nội bộ: Bộ công cụ hoàn chỉnh hỗ trợ các phép thuật phía sau hậu trường.
Chế độ bí mật: Trớ trêu thay, còn có một hệ thống con được thiết kế để ẩn tên mã nội bộ của Anthropic trong các cam kết git nhằm ngăn chặn rò rỉ… rõ ràng là không hiệu quả ở đây.
Các phụ thuộc npm, hooks, và các đường dẫn nhạy cảm về bảo mật: Cách nó tích hợp với các kho lưu trữ cục bộ, khóa API, và môi trường doanh nghiệp.
Lưu ý quan trọng: Đây KHÔNG phải trọng số của mô hình Claude cốt lõi, dữ liệu huấn luyện, hoặc chính LLM. Bạn không thể chạy “Claude 4” trên máy tại chỗ từ mã này. Những gì bị lộ là lớp frontend/agent – phần mềm tinh vi biến mô hình thô thành một agent lập trình mạnh mẽ. Tuy nhiên, đó chính là bí quyết làm cho Claude Code cảm thấy đẳng cấp hơn.
Tại sao điều này lại quan trọng đến vậy
Đối thủ vừa có bản thiết kế: OpenAI, Google, xAI, bất kỳ ai xây dựng công cụ agentic giờ đây đều có bản đồ chi tiết về cách Anthropic xây dựng một trong những nền tảng tốt nhất. Việc đảo ngược kỹ thuật trở nên dễ dàng gấp 1000 lần.
Áp lực an ninh cho người dùng: Các doanh nghiệp sử dụng Claude Code giờ đây phải kiểm tra mọi thứ. Các repo độc hại có thể lợi dụng chính các hook và quá trình nền bị lộ này. Anthropic khuyên mọi người chuyển sang cài đặt gốc và thay đổi khóa API.
Đây là vụ rò rỉ lớn thứ hai trong vài ngày: Chỉ vài ngày trước, Anthropic đã vô tình để lộ khoảng 3.000 tệp nội bộ, bao gồm cả bản nháp bài blog về mô hình khổng lồ sắp ra mắt mang mã Mythos (cũng gọi là Capybara nội bộ). Vụ này đã gây ra nhiều lo ngại về an ninh mạng. Giờ lại thêm vụ này? Hai vết thương tự gây ra trong chưa đầy một tuần.
Điều mỉa mai như một nụ hôn của đầu bếp: Chính mã nguồn bị rò rỉ còn chứa các hệ thống được thiết kế để ngăn chặn chính xác loại rò rỉ này. Và thế mà… chúng ta vẫn ở đây.
Các nhà phát triển đã bắt đầu điên cuồng. Một số đã dùng mã nguồn bị lộ để xây dựng các phiên bản mã nguồn mở thay thế. Những người khác đang phân tích cách Anthropic xử lý bộ nhớ dài hạn và điều phối đa agent. Các repo trên GitHub sao chép mã này đã nhận hàng nghìn sao trong vòng vài giờ. Các cộng đồng phát triển Trung Quốc đã sục sôi các nhóm WeChat với các bản fork.
Phản hồi chính thức của Anthropic
Họ xác nhận đó là “một số mã nguồn nội bộ” bị rò rỉ qua một bản phát hành Claude Code do lỗi con người (không phải hack). Không có dữ liệu khách hàng hoặc thông tin đăng nhập nào bị lộ. Họ đang cải thiện quy trình để tránh việc này trong tương lai. Một tuyên bố kiểu “chỉ là lỗi đóng gói” quen thuộc.
Nhưng hãy thành thật – khi kiến trúc cốt lõi của sản phẩm trị giá 2,5 tỷ USD của bạn giờ đã công khai, “sơ suất nhỏ” có vẻ hơi nhỏ bé.
Chuyện gì sẽ xảy ra tiếp theo?
Liệu điều này có thúc đẩy các framework agentic mã nguồn mở không? Có thể.
Liệu các đối thủ có tung ra tính năng nhanh hơn vì điều này không? Chắc chắn rồi.
Liệu lòng tin vào Anthropic có bị ảnh hưởng không? Với các doanh nghiệp bỏ ra số tiền lớn để đảm bảo an ninh và độ tin cậy… vâng, câu hỏi sẽ được đặt ra.
Và câu hỏi lớn nhất: Điều này có chứng minh rằng ngay cả các công ty AI hàng đầu cũng không thể giữ bí mật mã của chính mình vào năm 2026 không?
Vụ rò rỉ này không chỉ là drama công nghệ. Nó là một cái nhìn về độ mong manh của chuỗi cung ứng của các ông lớn, khi chỉ một dòng .npmignore bị thiếu có thể làm lộ nửa triệu dòng mã sáng tạo độc quyền.
Hãy để lại ý kiến của bạn bên dưới. Bạn đã xem mã nguồn bị lộ chưa? Điều gì làm bạn ngạc nhiên nhất? Bạn thuộc đội “điều này thật tuyệt cho cộng đồng” hay đội “Anthropic vừa trao cơ hội cho đối thủ”?
Tag bạn bè nhà phát triển của bạn. Vụ này sẽ đi vào lịch sử AI.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

1 thích