لتقليد الأصوات البشرية بواقعية مدهشة.. ميتا تطلق نموذج "Spirit LM"

تلفزيون سوريا ـ إسطنبول

⁺A

حجم الخط

أعلنت شركة "ميتا" عن إطلاق نموذجها الجديد "Spirit LM"، المفتوح المصدر، والذي يمثل خطوة نوعية في مجال الذكاء الصناعي المتعدد الوسائط، إذ يركز على معالجة التحديات المتعلقة بتوليد الأصوات وتقليد الصوت البشري بواقعية ودقة أكبر.

ويعتمد "Spirit LM" على نموذج لغوي مدرب مسبقاً يتضمن 7 مليارات معلمة، ويتميز عن النماذج التقليدية التي تعتمد على تقنيات التعرف التلقائي على الكلام (ASR) بقدرته المتقدمة على معالجة الصوت بطرق مبتكرة.

ويهدف هذا النموذج إلى تقديم تجربة صوتية تعكس تعابير الإنسان بشكل أكبر، مما يمثل نقلة نوعية في تطوير روبوتات ذكية قادرة على التفاعل الصوتي بشكل أكثر تعقيداً وواقعية.

اقرأ أيضاً

"موفي جين".. ميتا تكشف عن أداة ذكاء اصطناعي لإنتاج مقاطع صوت وصورة

وأوضحت "ميتا" أن الأساليب التقليدية تفتقر إلى التعبير الصوتي الطبيعي، لذلك يعتمد "Spirit LM" على رموز الفونيم (الوحدات الصوتية) والنغمات ودرجات الصوت، مما يسمح بتجاوز هذه القيود، ليتمكن النموذج من إنتاج أصوات أقرب إلى الطبيعة، بالإضافة إلى قدرته على التعلم من مهام جديدة تشمل تحويل النص إلى صوت، وتصنيف الكلام، والتعرف إلى الأصوات.

متى سيتاح نموذج "Spirit LM"؟

بينت شركة ميتا أن النموذج متاح الآن كمشروع مفتوح المصدر للمطورين والباحثين، بهدف توسيع نطاق استخدامه وتطويره.

ومن المتوقع أن يتم دمج "Spirit LM" في القريب العاجل ضمن تطبيقات "ميتا" مثل واتساب، إنستغرام، وفيسبوك، مما سيوفر للمستخدمين إمكانية التفاعل مع الذكاء الصناعي من خلال محادثات صوتية طبيعية وغنية بالتعبيرات، مشابهة للوضع الصوتي المتقدم الذي قدمته شركة OpenAI مؤخراً.

اقرأ أيضاً