微软最新的AI突破刚刚登场——VibeVoice-Realtime-0.5B正式发布。这款产品配备了一个拥有15亿参数的TTS引擎,正在刷新现有基准测试记录。吸引我注意的是什么?几乎瞬时的响应时间——大约300毫秒你就能听到第一个声音。对于文本转语音来说,这已经非常快了。而且亮点在于:它完全开源,采用MIT许可证,这意味着开发者可以真正无后顾之忧地使用它进行开发。对于任何从事语音界面或实时通信工具开发的人来说,这可能会带来巨大改变。一个科技巨头将如此强大的工具开放给社区?这正是能够加速整个行业创新的举措。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 4
  • 转发
  • 分享
评论
0/400
WalletWhisperervip
· 20小时前
300毫秒延迟……模式识别现在在疯狂预警。开源举措是教科书式的吸筹策略——观察行为指标的演变。
查看原文回复0
GateUser-75ee51e7vip
· 21小时前
300毫秒就出声?微软这次真的没吹牛,MIT开源这一手确实绝
回复0
戴上帽子说话vip
· 21小时前
300毫秒就出声?微软这次确实有点东西,开源还是MIT,这下开发者真的爽了
回复0
炒币老母亲vip
· 21小时前
300毫秒出声?这速度真的绝了,终于能做实时对话了
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)