إعلان الرئيسية

رائج

 في تطور مثير في مجال الذكاء الاصطناعي، أعلنت مايكروسوفت عن إنجاز جديد يتمثل في نموذج ذكاء اصطناعي متطور، يُعرف باسم VASA-1، قادر على إحياء الصور الثابتة بتحويلها إلى مقاطع فيديو واقعية تُظهر وجوهًا بشرية تتحدث بطلاقة.


مايكروسوفت تعلن عن نموذج لتحويل الصورة إلى فيديو


يتميز هذا النموذج بقدرته على استخدام صورة فردية ومقطع صوتي لإنتاج فيديو يتضمن حركات شفاه متزامنة مع الصوت، إلى جانب تعبيرات وجهية وحركات رأس تُضفي الطبيعية على الشخصية المُجسدة.


مع ذلك، تُظهر مايكروسوفت حذرًا في توجيه استخدامات هذه التقنية، مُشيرة إلى أنها لن تُطلق منتجًا تجاريًا أو واجهة برمجة تطبيقات تستغل قدرات VASA-1، نظرًا للمخاطر المحتملة المتعلقة بإساءة استخدام تقنيات التزييف العميق.


تُبرز الشركة الإمكانيات الفنية للنموذج، مُعلنة أنه يمكنه إنتاج مقاطع فيديو بدقة 512×512 بكسل وبمعدل 40 إطارًا في الثانية، مما يُعد إنجازًا ملحوظًا في هذا المجال.


يُعزز VASA-1 من تجربة المستخدم بتقديم مقاطع فيديو تصل إلى دقيقة واحدة بجودة عالية، مع تأخير زمني ضئيل، مما يُمكن من إنتاج الفيديو عبر الإنترنت بكفاءة عالية.


يُقدم النموذج أيضًا مستوى عالٍ من التحكم للمستخدمين، مما يسمح بتعديل الاتجاه الرئيسي لنظرة العين، ومسافة الرأس، وغيرها من الجوانب الحيوية التي تُسهم في تحقيق وضعية رأس ثلاثية الأبعاد وديناميكيات وجهية مُقنعة.


يُظهر النموذج قدرة استثنائية على التعامل مع الصور الفنية والصوت الغنائي والكلام بلغات متعددة، مما يُعزز من مرونته ويُوسع نطاق استخداماته.


تُشدد مايكروسوفت على التزامها بتطوير الذكاء الاصطناعي المسؤول، مع التركيز على الاستخدامات الإيجابية مثل تحسين الفرص التعليمية، دعم الأفراد ذوي التحديات التواصلية، وتقديم الدعم العلاجي، مُؤكدة على أهمية الاستخدام الأخلاقي للتكنولوجيا.

ليست هناك تعليقات
إرسال تعليق

إعلان أول الموضوع

إعلان وسط الموضوع

إعلان أخر الموضوع

Back to top button