Recentemente vi esta notícia, a NVIDIA adquiriu no final do ano passado o negócio de inferência de chips da Groq, e a lógica desta transação é bastante interessante.



Huang Renxun explicou pela primeira vez detalhadamente na conferência GTC deste ano por que decidiu adquirir a Groq. Em resumo, percebeu que o mercado de inferência está a se dividir. Antes, todos focavam apenas numa meta: maximizar a taxa de transferência. Mas agora a situação mudou, diferentes utilizadores estão dispostos a pagar preços diferentes por respostas com diferentes velocidades.

A lógica aqui é fundamental — se eu puder oferecer aos desenvolvedores uma resposta de token mais rápida, aumentando a sua eficiência, eles estarão dispostos a pagar por isso. Este mercado de alto valor e baixa latência é, na verdade, uma oportunidade que surgiu recentemente. Huang chamou isso de expansão da fronteira de Pareto no mercado de inferência: antes era uma solução de alta taxa de transferência, agora há uma nova vertente, que é uma solução de baixa latência e alto preço unitário.

E a Groq é precisamente especialista nesta área. A sua arquitetura LPU é conhecida pela sua baixa latência determinística, o que é completamente complementar à direção de alta taxa de transferência das GPUs da NVIDIA. A Groq lançou em março a sua LPU 3, que utiliza tecnologia de 4nm da Samsung, e a sua capacidade de inferência em modelos de trilhões de parâmetros é 35 vezes superior à do Blackwell NVL72, o que é realmente impressionante.

Do ponto de vista da linha de produtos, esta aquisição preenche uma lacuna no mercado de inferência da NVIDIA. Pense bem, com o mesmo modelo, diferentes estratégias de preço podem ser aplicadas dependendo do tempo de resposta — embora a taxa de transferência seja um pouco menor, o preço unitário pode compensar. A integração da Groq permite à NVIDIA ter uma cobertura mais completa no mercado de inferência. Do ponto de vista estratégico, esta transação faz todo o sentido.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar