微軟最新的 AI 突破正式登場 —— VibeVoice-Realtime-0.5B 正式發布。這款產品搭載了 15 億參數的 TTS 引擎,已經打破現有基準測試。最吸引我注意的是它幾乎即時的回應速度——大約 300 毫秒內就能聽到第一個聲音。對於文字轉語音來說,這真的非常快。更厲害的是:它完全開源,採用 MIT 授權,這代表開發者可以真正用它來構建產品,無需授權煩惱。對於任何從事語音介面或即時通訊工具開發的人來說,這都可能是一個改變遊戲規則的工具。科技巨頭願意將這麼強大的技術釋放給社群?這種舉動,絕對能推動整個產業的創新加速。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 4
  • 轉發
  • 分享
留言
0/400
WalletWhisperervip
· 18小時前
300毫秒延遲……現在模式識別正大聲呼喊。開源舉措是教科書式的累積策略——觀察行為指標如何展開。
查看原文回復0
GateUser-75ee51e7vip
· 18小時前
300毫秒就出聲?微軟這次真的沒誇大,MIT開源這一招確實絕了
查看原文回復0
戴上帽子说话vip
· 18小時前
300毫秒就出聲?微軟這次確實有點東西,開源還是MIT,這下開發者真的爽了
查看原文回復0
炒币老母亲vip
· 18小時前
300毫秒發聲?這速度真的太厲害了,終於能做到即時對話了
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)