A Anthropic revelou como as empresas chinesas de IA estão a roubar dados do Claude para criar os seus próprios LLM!



Antes de avançar, lembro que há alguns dias publiquei que, "No que diz respeito ao uso de API, as 5 principais empresas de IA do mundo, 4 estão sob controlo chinês. Os modelos de IA chineses que produzem resultados semelhantes ao Claude têm custos de API cerca de 8-10 vezes mais baixos. É por isso que esses modelos estão a ser tão utilizados na indústria." Mas como é que eles conseguiram essa capacidade?

Vamos tentar entender em detalhes.

DeepSeek, Moonshot AI (Kimi) e MiniMax são as empresas contra as quais a Anthropic apresentou queixa, alegando que lançaram um ataque de extração industrial contra o modelo Claude. Ou seja, copiaram exatamente as capacidades avançadas do Claude e tentaram treinar os seus próprios modelos com esses dados. Para isso, abriram cerca de 24 mil contas falsas e interagiram com Claude mais de 16 milhões de vezes. O objetivo era dominar as capacidades avançadas de raciocínio, comportamento de agentes, habilidades de codificação e uso de ferramentas do Claude.

A DeepSeek realizou cerca de 150 mil interações com campanhas de prompts para tentar descobrir a lógica interna ou raciocínio passo a passo do Claude. Além disso, usaram o Claude como sistema de classificação para julgar as saídas dos seus próprios modelos! Por outro lado, a Moonshot AI realizou cerca de 3,4 milhões de interações apenas para copiar raciocínio de agentes e uso de ferramentas. E a mais agressiva foi a MiniMax, que realizou aproximadamente 130 milhões de interações, focando principalmente em codificação e orquestração. Curiosamente, quando a Anthropic detecta e bloqueia essas atividades, eles mudam rapidamente para um novo modelo da Anthropic e continuam a extrair dados.

Todo esse trabalho foi feito de forma altamente planeada e descentralizada. Para evitar a deteção, usaram IPs rotativos, métodos de pagamento partilhados e atividades sincronizadas entre milhares de contas. Chegou ao ponto de se dizer que esta é a maior campanha de destilação de modelos de IA já documentada.

O contexto geopolítico por trás também é bastante interessante. Há alguns dias, a OpenAI enviou um memorando ao governo dos EUA alertando que os laboratórios chineses estão a tentar, indiretamente, aceder aos modelos frontais dos EUA.

Mas a questão é: o que vão fazer com todos esses dados roubados?
A resposta é que, usando os dados avançados do Claude, eles vão tornar os seus próprios modelos mais poderosos. Processar esses enormes volumes de dados para treinar IA requer centros de dados gigantes e supercomputadores, que consomem muita energia. Surpreendentemente, só em 2025, a China adicionou mais de 500 gigawatts de nova capacidade de energia, quase 10 vezes mais do que os EUA!

Ou seja, eles planejaram toda a estratégia de extrair dados dos modelos americanos e usar essa infraestrutura de IA para operar em escala industrial. Até agora, nenhuma das três empresas chinesas acusadas de roubo de dados negou publicamente as alegações.
Ver original
post-image
post-image
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar

Negocie criptomoedas a qualquer hora e em qualquer lugar
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)