أحدث اختراق في الذكاء الاصطناعي من مايكروسوفت وصل للتو - VibeVoice-Realtime-0.5B أصبح متوفر رسميًا. هذا النظام يحتوي على محرك تحويل نص إلى كلام TTS بعدد 1.5B من المعاملات، ويتفوق على المعايير الحالية. ما لفت انتباهي؟ زمن الاستجابة شبه الفوري - نحن نتحدث عن حوالي 300 ملي ثانية قبل أن تسمع الصوت الأول. هذا سريع جدًا بالنسبة لتحويل النص إلى كلام. والمميز هنا: أنه مفتوح المصدر بالكامل بموجب رخصة MIT، مما يعني أن المطورين يمكنهم فعليًا البناء عليه بدون مشاكل تراخيص. لأي شخص يعمل على واجهات صوتية أو أدوات تواصل في الوقت الفعلي، هذا قد يغير قواعد اللعبة. حقيقة أن عملاق تقني يطرح شيء بهذه القوة للمجتمع؟ هذا النوع من الخطوات يسرّع الابتكار في جميع المجالات.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 4
  • إعادة النشر
  • مشاركة
تعليق
0/400
WalletWhisperervip
· 12-05 17:44
تأخير 300 مللي ثانية... التعرف على الأنماط يصرخ الآن. خطوة المصادر المفتوحة هي استراتيجية تجميع نموذجية—راقب مؤشرات السلوك تتكشف.
شاهد النسخة الأصليةرد0
GateUser-75ee51e7vip
· 12-05 17:34
يصدر الصوت خلال 300 مللي ثانية فقط؟ هذه المرة مايكروسوفت فعلاً لم تبالغ، وهذه الخطوة المفتوحة المصدر من MIT بالفعل مذهلة
شاهد النسخة الأصليةرد0
SpeakWithHatOnvip
· 12-05 17:34
يصدر الصوت خلال 300 مللي ثانية؟ مايكروسوفت فعلاً أبدعت هذه المرة، والمشروع مفتوح المصدر وبتراخيص MIT، الآن المطورون فعلاً سيستمتعون.
شاهد النسخة الأصليةرد0
CryptoMomvip
· 12-05 17:24
النطق خلال 300 مللي ثانية؟ هذا السرعة فعلاً مذهلة، أخيراً أصبح بإمكاننا إجراء محادثة في الوقت الفعلي.
شاهد النسخة الأصليةرد0
  • Gate Fun الساخنعرض المزيد
  • القيمة السوقية:$6.55Kعدد الحائزين:5
    13.46%
  • القيمة السوقية:$3.53Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.53Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.52Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.53Kعدد الحائزين:1
    0.00%
  • تثبيت