NVIDIA, Whisper ve Canary Modelleri ile Riva ASR Yeteneklerini Genişletiyor

robot
Abstract generation in progress

Rebeca Moen

Şubat 21, 2025 10: 54

NVIDIA, çevrimdışı ve otomatik konuşma çevirisi için gelişmiş özellikleri entegre ederek Whisper ve Canary modellerini kullanarak Riva ASR'yi yeni çok dilli yeteneklerle geliştiriyor.

NVIDIA, Whisper ve Canary Modelleri ile Riva ASR Yeteneklerini Genişletiyor

NVIDIA, Riva 2.18.0 konteyneri ve SDK aracılığıyla gelişmiş yetenekler sunarak Otomatik Konuşma Tanıma (ASR) sistemlerini geliştirmekte önemli adımlar atmıştır. Bu gelişmeler, NVIDIA'nın GPU hızlandırmalı konuşma ve çeviri yapay zeka mikroservislerini mükemmelleştirme çabalarının bir parçasıdır ve NVIDIA Geliştirici Blogu'nda Sven Chilton tarafından detaylı olarak açıklanmıştır.

Yeni Modellerin Entegrasyonu

Riva'nın en son iterasyonu, çok dilli akış ASR'yi kolaylaştıran Papağan mimarisi desteğini içerir ve çevrimdışı ASR ve Otomatik Konuşma Çevirisi (AST) için Fısıltı ve Kanarya modellerini sağlar. OpenAI tarafından geliştirilen Fısıltı ve HuggingFace tarafından geliştirilen Distil-Fısıltı modelleri artık Riva'nın çevrimdışı ASR yetenekleri için ayrılmaz bir parça haline gelmiştir, bu da birçok dilde ses kayıtlarının doğrudan İngilizce'ye transkripsiyonunu ve çevirisini sağlar.

Canary modelleri, Any-to-English, English-to-Any ve Any-to-Any çevirileri dahil olmak üzere birden çok dil kombinasyonunda çevrimdışı ASR ve AST'yi destekleyerek Riva'nın işlevselliğini daha da genişletir. Bu modeller, dil algılama ve çeviri görevleri için güçlü destek sunarak çeşitli dil ihtiyaçlarını karşılar.

Seçmeli NMT Devre Dışı Bırakma

Bu güncellemede tanıtılan dikkate değer özelliklerden biri, SSML etiketini kullanarak Sinirsel Makine Çevirisinin (NMT) sürecinin belirli bölümlerini seçmeli olarak devre dışı bırakma yeteneğidir. Bu özellik, kullanıcıların çevrilmemesi gereken metin segmentlerini belirtmelerine olanak tanır, çeviri çıktıları üzerinde daha fazla kontrol sağlar. Ayrıca, yeni bir DNT sözlüğü, belirli kelimelerin veya ifadelerin nasıl çevrileceğini belirtmeye olanak tanır, çeviri süreçlerinin özelleştirilmesini geliştirir.

Dağıtım ve Kullanım

Bu yeni yeteneklerin dağıtımı, Whisper ve Canary işlevlerine sahip bir Riva sunucusu kurmak için gerekli komut dosyalarını ve yapılandırma dosyalarını içeren Riva Becerileri Hızlı Başlangıç kaynak klasörü aracılığıyla kolaylaştırılmıştır. Kullanıcılar, model dağıtımını GPU mimarilerine göre optimize etmek için sağlanan komut dosyalarını kullanarak özel ASR ihtiyaçlarına göre Whisper ve Canary modelleri arasında seçim yapabilir.

NVIDIA'nın ASR sistemlerinin dil ve işlevsel kapsamını genişletme konusundaki taahhüdü, bu gelişmiş modellerin ve özelliklerin entegrasyonunda açıkça görülmektedir. Daha geniş bir dil yelpazesini destekleyerek ve gelişmiş çeviri kontrolleri sunarak, Riva konuşma tanıma ve çeviri teknolojisinde endüstri standartlarını belirlemeye devam ediyor.

NVIDIA'nın en son ASR ilerlemeleri hakkında daha fazla bilgi için NVIDIA Geliştirici Blogu'nu ziyaret edin.

Görüntü kaynağı: Shutterstock

View Original
The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
  • Pin