📰 【Nvidia lança o modelo Nemotron3 Nano Omni: capaz de processar unificadamente vídeo, áudio, imagens e texto, melhorando a eficiência da inferência multimodal】


BlockBeats informa, 29 de abril, a Nvidia lançou oficialmente o Nemotron 3 Nano Omni, que é um novo membro da série Nemotron 3, integrando a inferência multimodal unificada em um único modelo eficiente e de código aberto. A Nvidia afirmou que os sistemas inteligentes geralmente precisam realizar um ciclo de percepção a ação que envolve tela, documentos, áudio, vídeo e texto, mas ainda dependem de cadeias de modelos fragmentadas — pilhas tecnológicas separadas para visão, áudio e texto.
Isso aumenta o número de saltos na inferência e a complexidade da orquestração, elevando o custo da inferência, ao mesmo tempo que enfraquece a consistência do contexto entre os modos. O Nemotron 3 Nano Omni visa substituir essa fragmentação...
A Nvidia lançou um novo modelo, integrando a pilha tecnológica fragmentada em um único código aberto. Parece muito legal, mas no mundo das criptomoedas ninguém se importa com isso, a menos que possa rodar diretamente DePIN ou AI Agent. Caso contrário, é apenas mais combustível para a bolha.👇👇👇👇👇
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar