أعلنت شركة "ميتا"، المالكة لمنصات فيسبوك وإنستغرام وواتساب، عن إطلاق مشروع جديد يحمل اسم "NotebookLlama"، وهو نظام مفتوح المصدر لإنشاء حلقات "البودكاست" باستخدام الذكاء الصناعي.
ويأتي هذا المشروع في إطار منافسة مباشرة من ميتا مع منصة غوغل ومشروعها "NotebookLM"، الذي حظي بشهرة واسعة مؤخراً بفضل قدرته على تحويل النصوص إلى محتوى صوتي تفاعلي.
آلية عمل "NotebookLlama"
ويعتمد "NotebookLlama" على نماذج الذكاء الصناعي الخاصة بميتا، المعروفة باسم "Llama"، لتنفيذ المهام المعقدة في معالجة النصوص وتحويلها إلى بودكاست بأسلوب حواري.
وتبدأ العملية بتحويل النصوص، مثل المقالات أو المنشورات، إلى ملفات صوتية، ثم تُضاف "لمسات درامية" وتفاعلات تهدف إلى إضفاء الحيوية على النصوص، لتبدو كنقاشات حية أو حلقات بودكاست حقيقية.
مشكلات في "NotebookLlama"
وفي الوقت الحالي، لا تضاهي نتائج أداة "NotebookLlama" الجودة الصوتية لأداة "NotebookLM" من غوغل، إذ تعاني عينات الصوت في أداة ميتا من بعض القصور، حيث تبدو الأصوات آلية وغير طبيعية إلى حد كبير، مع تداخل غير متناسق بين الجمل.
وأكد باحثو ميتا أن هناك خططاً لتحسين الأداء عبر نماذج أكثر قوة في تحويل النصوص إلى كلام، مشيرين إلى أن تحسين جودة الصوت يتطلب نماذج متقدمة لتقديم تجربة أقرب للطبيعية.
كما بين الباحثون أيضاً أنه يمكن تعزيز الأسلوب الحواري عن طريق استخدام نموذجين من الذكاء الصناعي يتحاوران ويطرحان هيكل النقاش، بدلاً من الاعتماد على نموذج واحد فقط كما هو الحال حالياً.
يذكر أن "NotebookLlama" ليست المحاولة الأولى لاستنساخ ميزة البودكاست من أداة غوغل "NotebookLM"، إذ ظهرت عدة مشاريع تسعى لتحقيق هذا الأداء، لكن ما زالت أدوات الذكاء الصناعي، بما فيها أداة غوغل، تواجه تحديات في معالجة مشكلة "الهلوسة"، التي قد تؤدي أحياناً إلى توليد محتوى غير دقيق أو معلومات مختلقة.