Rebeca Moen 21 กุมภาพันธ์ 2568 10:54 NVIDIA ปรับปรุง Riva ASR ของตนด้วยความสามารถในภาษาหลากหลายด้วยรุ่น Whisper และ Canary โดยรวมฟีเจอร์ขั้นสูงสำหรับการแปลภาษาพูดแบบออฟไลน์และอัตโนมัติ ! [NVIDIA ขยายความสามารถของ Riva ASR ด้วยรุ่น Whisper และ Canary](https://img.gateio.im/social/moments-640ea0fcb3b5ee18827a1ee3ad912a1a) NVIDIA ได้เดินทางไปอย่างมีนัยสำคัญในการขับเคลื่อนระบบการจดจำเสียงอัตโนมัติ (ASR) ของตนโดยการนำเสนอความสามารถที่ปรับปรุงขึ้นผ่านคอนเทนเนอร์และ SDK ของ Riva 2.18.0 พัฒนาเหล่านี้เป็นส่วนหนึ่งของความพยายามของ NVIDIA เพื่อประสบความสำเร็จในการปรับปรุงบริการของ AI ที่ใช้ในการบริการเสียงและแปลภาษาที่มีการเร่ง GPU ตามที่ Sven Chilton ได้รายงานในบล็อกนักพัฒนาซอฟต์แวร์ของ NVIDIA## บูรณาการของรุ่นใหม่การพัฒนาล่าสุดของ Riva รวมถึงการสนับสนุนสำหรับสถาปัตยกรรม Parakeet ซึ่งสะดวกสำหรับการสตรีม ASR หลายภาษาและโมเดล Whisper และ Canary สำหรับ ASR แบบแบ่ง และการแปลภาษาอัตโนมัติ (AST) โมเดล Whisper ที่พัฒนาโดย OpenAI และโมเดล Distil-Whisper โดย HuggingFace เป็นส่วนประกอบสำคัญของความสามารถในการทำ ASR แบบแบ่งของ Riva ซึ่งทำให้สามารถถอดรหัสและแปลคำพูดจากการบันทึกเสียงในภาษาต่าง ๆ โดยตรงเป็นภาษาอังกฤษโมเดล Canary ขยายฟังก์ชันอาณาเบกของ Riva ได้อย่างเต็มที่โดยรองรับการใช้งาน ASR และ AST แบบออฟไลน์ในหลายภาษา รวมถึงการแปล Any-to-English, English-to-Any, และ Any-to-Any โมเดลเหล่านี้เหมาะสำหรับความต้องการทางภาษาที่หลากหลาย มีการสนับสนุนที่แข็งแรงสำหรับงานตรวจจับภาษาและงานแปลภาษา## ปิดการทำงาน NMT แบบเลือกที่หนึ่งในคุณลักษณะที่น่าสังเกตที่ถูกนำเสนอในการอัปเดตนี้คือความสามารถในการปิดใช้งานบางส่วนของกระบวนการแปลภาษาเครื่องจักรปรับปรุง (NMT) โดยใช้แท็ก SSML คุณลักษณะนี้ช่วยให้ผู้ใช้สามารถระบุส่วนของข้อความที่ไม่ควรถูกแปล ซึ่งทำให้มีการควบคุมมากขึ้นเกี่ยวกับผลลัพธ์ของการแปล นอกจากนี้ มีพจนานุกรม DNT ใหม่ที่ทำให้สามารถระบุว่าคำหรือวลีบางคำควรถูกแปลอย่างไร ซึ่งเพิ่มความปรับแต่งของกระบวนการแปล## การใช้งานและการใช้งานการติดตั้งความสามารถใหม่เหล่านี้ถูกจัดการอย่างเรียบง่ายผ่านโฟลเดอร์ทรัพยากรเริ่มต้น Quick Start ของ Riva Skills ซึ่งรวมถึงสคริปต์และไฟล์กำหนดค่าที่จำเป็นสำหรับการตั้งค่าเซิร์ฟเวอร์ Riva พร้อมกับความสามารถ Whisper และ Canary Users สามารถเลือกระหว่างโมเดล Whisper และ Canary ขึ้นอยู่กับความต้องการในด้าน ASR ที่เฉพาะเจาะจงของพวกเขา โดยใช้สคริปต์ที่ให้มาเพื่อปรับปรุงการติดตั้งโมเดลตามโครงสร้าง GPU ของพวกเขาการทุนของ NVIDIA ในการขยายขอบเขตทางภาษาและฟังก์ชันของระบบ ASR ของตนเป็นชัดเจนในการรวมระบบแบบล่วงหน้าและคุณสมบัติเหล่านี้ โดยการสนับสนุนช่วงภาษาที่กว้างขึ้นและการให้ควบคุมการแปลที่ปรับปรุง Riva ยังคงตั้งมาตรฐานในเทคโนโลยีการจดจำเสียงและการแปลสำหรับข้อมูลเพิ่มเติมเกี่ยวกับความก้าวหน้าล่าสุดของ NVIDIA ASR กรุณาเยี่ยมชม NVIDIA Developer Blog*ที่มาของภาพ: Shutterstock*
NVIDIA ขยายความสามารถ ASR ของ Riva ด้วยโมเดล Whisper และ Canary
Rebeca Moen
21 กุมภาพันธ์ 2568 10:54
NVIDIA ปรับปรุง Riva ASR ของตนด้วยความสามารถในภาษาหลากหลายด้วยรุ่น Whisper และ Canary โดยรวมฟีเจอร์ขั้นสูงสำหรับการแปลภาษาพูดแบบออฟไลน์และอัตโนมัติ
! NVIDIA ขยายความสามารถของ Riva ASR ด้วยรุ่น Whisper และ Canary
NVIDIA ได้เดินทางไปอย่างมีนัยสำคัญในการขับเคลื่อนระบบการจดจำเสียงอัตโนมัติ (ASR) ของตนโดยการนำเสนอความสามารถที่ปรับปรุงขึ้นผ่านคอนเทนเนอร์และ SDK ของ Riva 2.18.0 พัฒนาเหล่านี้เป็นส่วนหนึ่งของความพยายามของ NVIDIA เพื่อประสบความสำเร็จในการปรับปรุงบริการของ AI ที่ใช้ในการบริการเสียงและแปลภาษาที่มีการเร่ง GPU ตามที่ Sven Chilton ได้รายงานในบล็อกนักพัฒนาซอฟต์แวร์ของ NVIDIA
บูรณาการของรุ่นใหม่
การพัฒนาล่าสุดของ Riva รวมถึงการสนับสนุนสำหรับสถาปัตยกรรม Parakeet ซึ่งสะดวกสำหรับการสตรีม ASR หลายภาษาและโมเดล Whisper และ Canary สำหรับ ASR แบบแบ่ง และการแปลภาษาอัตโนมัติ (AST) โมเดล Whisper ที่พัฒนาโดย OpenAI และโมเดล Distil-Whisper โดย HuggingFace เป็นส่วนประกอบสำคัญของความสามารถในการทำ ASR แบบแบ่งของ Riva ซึ่งทำให้สามารถถอดรหัสและแปลคำพูดจากการบันทึกเสียงในภาษาต่าง ๆ โดยตรงเป็นภาษาอังกฤษ
โมเดล Canary ขยายฟังก์ชันอาณาเบกของ Riva ได้อย่างเต็มที่โดยรองรับการใช้งาน ASR และ AST แบบออฟไลน์ในหลายภาษา รวมถึงการแปล Any-to-English, English-to-Any, และ Any-to-Any โมเดลเหล่านี้เหมาะสำหรับความต้องการทางภาษาที่หลากหลาย มีการสนับสนุนที่แข็งแรงสำหรับงานตรวจจับภาษาและงานแปลภาษา
ปิดการทำงาน NMT แบบเลือกที่
หนึ่งในคุณลักษณะที่น่าสังเกตที่ถูกนำเสนอในการอัปเดตนี้คือความสามารถในการปิดใช้งานบางส่วนของกระบวนการแปลภาษาเครื่องจักรปรับปรุง (NMT) โดยใช้แท็ก SSML คุณลักษณะนี้ช่วยให้ผู้ใช้สามารถระบุส่วนของข้อความที่ไม่ควรถูกแปล ซึ่งทำให้มีการควบคุมมากขึ้นเกี่ยวกับผลลัพธ์ของการแปล นอกจากนี้ มีพจนานุกรม DNT ใหม่ที่ทำให้สามารถระบุว่าคำหรือวลีบางคำควรถูกแปลอย่างไร ซึ่งเพิ่มความปรับแต่งของกระบวนการแปล
การใช้งานและการใช้งาน
การติดตั้งความสามารถใหม่เหล่านี้ถูกจัดการอย่างเรียบง่ายผ่านโฟลเดอร์ทรัพยากรเริ่มต้น Quick Start ของ Riva Skills ซึ่งรวมถึงสคริปต์และไฟล์กำหนดค่าที่จำเป็นสำหรับการตั้งค่าเซิร์ฟเวอร์ Riva พร้อมกับความสามารถ Whisper และ Canary Users สามารถเลือกระหว่างโมเดล Whisper และ Canary ขึ้นอยู่กับความต้องการในด้าน ASR ที่เฉพาะเจาะจงของพวกเขา โดยใช้สคริปต์ที่ให้มาเพื่อปรับปรุงการติดตั้งโมเดลตามโครงสร้าง GPU ของพวกเขา
การทุนของ NVIDIA ในการขยายขอบเขตทางภาษาและฟังก์ชันของระบบ ASR ของตนเป็นชัดเจนในการรวมระบบแบบล่วงหน้าและคุณสมบัติเหล่านี้ โดยการสนับสนุนช่วงภาษาที่กว้างขึ้นและการให้ควบคุมการแปลที่ปรับปรุง Riva ยังคงตั้งมาตรฐานในเทคโนโลยีการจดจำเสียงและการแปล
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับความก้าวหน้าล่าสุดของ NVIDIA ASR กรุณาเยี่ยมชม NVIDIA Developer Blog
ที่มาของภาพ: Shutterstock