📰 【NVIDIA lança o modelo Nemotron3 Nano Omni: capaz de processar vídeos, áudios, imagens e textos de forma unificada, aumentando a eficiência na inferência multimodal】


BlockBeats informa, 29 de abril, a NVIDIA lançou oficialmente o Nemotron 3 Nano Omni, que é um novo membro da série Nemotron 3, integrando a inferência multimodal unificada em um único modelo eficiente e de código aberto. A NVIDIA afirmou que os sistemas inteligentes geralmente precisam realizar um ciclo de percepção a ação entre tela, documentos, áudio, vídeo e texto, mas ainda dependem de cadeias de modelos fragmentadas — pilhas tecnológicas separadas para visão, áudio e texto.
Isso aumenta o número de saltos na inferência e a complexidade na orquestração, elevando o custo da inferência, ao mesmo tempo em que enfraquece a consistência do contexto entre os diferentes modos. O Nemotron 3 Nano Omni visa substituir essa fragmentação...
A NVIDIA lança um novo modelo, integrando stacks tecnológicos fragmentados em um único código aberto. Parece muito legal, mas no mundo cripto ninguém se importa com isso, a menos que possa rodar diretamente DePIN ou AI Agent. Caso contrário, é apenas mais combustível para a bolha.👇👇👇👇👇
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar