📰 【NVIDIA lance le modèle Nemotron3 Nano Omni : capable de traiter unifié vidéo, audio, images et texte, améliorant l'efficacité de l'inférence multimodale】


BlockBeats, 29 avril, NVIDIA a officiellement lancé Nemotron 3 Nano Omni, un nouveau membre de la série Nemotron 3, qui intègre l'inférence multimodale unifiée dans un seul modèle open source efficace. NVIDIA indique que les systèmes intelligents nécessitent généralement un cycle unique de perception à action entre l'écran, les documents, l'audio, la vidéo et le texte, mais dépendent encore de chaînes de modèles fragmentées — des stacks technologiques séparés pour la vision, l'audio et le texte.
Cela augmente le nombre de sauts d'inférence et la complexité de l'orchestration, ce qui augmente le coût de l'inférence tout en affaiblissant la cohérence du contexte intermodal.
Nemotron 3 Nano Omni vise à remplacer cette fragmentation...
NVIDIA lance un nouveau modèle, intégrant une stack technologique fragmentée en un seul modèle open source. Ça a l'air cool, mais personne dans la crypto ne s'en soucie, sauf si cela peut directement faire fonctionner DePIN ou un Agent IA. Sinon, c'est encore du carburant pour la bulle.👇👇👇👇👇
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler