تُحول الصوت والصورة لـ«وجه ناطق».. مايكروسوفت تبتكر أداة ذكاء اصطناعي جديدة

شيرين صبحي
تُحول الصوت والصورة لـ«وجه ناطق».. مايكروسوفت تبتكر أداة ذكاء اصطناعي جديدة

ابتكر باحثون من شركة “مايكروسوفت” أداة ذكاء اصطناعي قادرة على تحويل صورة وجه ومقطع صوتي إلى فيديو واقعي جداً لـ”وجه يتكلّم”، بحسب وثيقة نشرتها شركة التكنولوجيا الكبرى هذا الأسبوع.

وأشارت الشركة إلى أن “هدف الأداة لا يتمثل في إنشاء محتوى بقصد التضليل أو الخداع”، لافتة إلى أن “الأداة، وعلى غرار تقنيات إنشاء محتوى أخرى، قد تُستخدم لأهداف مسيئة وانتحال صفة أيّ كان”، وفق وكالة الصحافة الفرنسية، اليوم السبت 20 أبريل 2024.

مخاوف من الاحتيال

يثير النمو السريع للذكاء الاصطناعي التوليدي، الذي يتيح بسهولة إنتاج مختلف أنواع المحتوى.. نصوص وصور وأصوات.. بجودة عالية جداً، مخاوف كثيرة خصوصاً في ما يتعلق بالاستغلال لأغراض الاحتيال والتضليل.

وأوضحت مايكروسوفت أن “بحثنا يركز على الصور الرمزية الافتراضية (أفاتار)، بهدف الاستخدام الإيجابي”، مضيفة “نعارض أي سلوك يهدف إلى إنشاء محتوى مضلل أو ضار”.

فوائد متعددة

لا تعتزم شركة التكنولوجيا، وهي مستثمر رئيسي في “اوبن إيه آي” مبتكرة برنامج “تشات جي بي تي”، إتاحة الأداة الجديدة أو تقديم معلومات تقنية “طالما اننا غير متأكدين من أنّ الأداة ستُستخدم بشكل مسؤول بحسب القوانين المعمول بها”.

ويلتقط البرنامج المسمى “فاسا-1” (VASA-1) صورة وجه بسيطة ويسجل مقطعًا صوتيًا ويحولهما إلى شريط فيديو يظهر وجها يتحرك ويتكلم بطريقة واقعية جداً.

وأشارت “مايكروسوفت” إلى أنّ فوائد ابتكار هذه الأداة “مثل تعزيز المساواة في مجال التعليم، ومساعدة مَن يعانون صعوبات في التواصل، وتوفير الدعم العلاجي لمَن يحتاجونه”، تبرر العمل عليها.

ربما يعجبك أيضا