اخبار عربية وعالمية

“SpeechSSM” نموذج صوتي Produces كلامًا طبيعياً لمدة تصل إلى 16 دقيقة

وكالات – طوّرت باحثة كورية جنوبية نموذجاً لغوياً صوتياً جديداً يُعرف باسم “SpeechSSM”، الذي يمكّن من إنتاج كلام اصطناعي يبدو طبيعياً ومتواصلاً دون قيود زمنية. يُعتبر هذا النموذج خطوة رائدة في تكنولوجيا الذكاء الاصطناعي، حيث يتغلب على التحديات السابقة المتعلقة بإنتاج محتوى صوتي طويل مثل برامج البودكاست والكتب المسموعة.

النموذج، الذي تم تطويره من قِبل سي جين بارك، طالبة دكتوراه في فريق البروفيسور يونج مان رو، يدمج بين طبقات الانتباه والتكرار، ما يتيح له توليد كلام طويل مع الحفاظ على تماسك المعنى وسلاسة السرد. كما يقلل “SpeechSSM” من استهلاك الذاكرة والموارد الحاسوبية، إذ يمكنه معالجة تسلسلات الكلام غير المحدودة بكفاءة.

علاوة على ذلك، يستخدم النموذج في مرحلة توليد الصوت تقنية “SoundStorm”، مما يسمح له بإنشاء مقاطع صوتية تصل إلى 16 دقيقة بسرعة وجودة عالية. وقد طورت الباحثة مجموعة بيانات جديدة تحت اسم “LibriSpeech-Long” لتقييم قدرات النموذج في هذا السياق. النماذج اللغوية الصوتية تأتي لتكون الجيل الجديد في معالجة اللغة، مما يعزز قدرة الذكاء الاصطناعي على توفير محتوى متسق وذو جودة عالية في الاستخدامات اليومية.

جميع الأخبار المنشورة في موقع مانكيش نت لا تمثل ولأتعبر عن راي إدارة الموقع .
ننشر الأخبار من مصادر مختلفة اليا فقد يجد القارئ محتوى غير لائق للنشر الإلكتروني وحرصا من إدارة موقع مانكيش نت يمكنكم الاتصال بنا مباشرة عبر الضغط على اتصل بنا سنقوم مباشرة بمراجعة المحتوى و حذفه نهائيا إضافة الى مراجعة مصدر الخبر الذي قد يتعرض للإلغاء من قائمة المصادر نهائيا

Subscribe
نبّهني عن
guest
0 تعليقات
Oldest
Newest Most Voted
التقيمات المضمنة
عرض جميع التعليقات
زر الذهاب إلى الأعلى
Don`t copy text!