قامت شركة Synthesia، وهي شركة بريطانية مدعومة من شركة Nvidia العملاقة، بتقديم "Expressive Avatars". يسمح هذا التقدم للصور الرمزية المستندة إلى الذكاء الاصطناعي (AI) بمحاكاة المشاعر والإيماءات البشرية بدقة مذهلة. تم الكشف عن الميزة الجديدة في 25 أبريل، ووعدت بتغيير طريقة تقديم العروض التقديمية والتسويق والتدريب للشركات.
كانت تقنية الذكاء الاصطناعي التوليدي معروفة بالفعل بقدرتها على إنشاء صور وحركات واقعية. المثال الأكثر شهرة على ذلك هو مولد الفيديو Sora من OpenAI. ومع ذلك، واجهت هذه التقنيات تحديات مثل تشوهات اليد والأطراف وضعف مزامنة الشفاه. عالجت Synthesia هذه المشكلات من خلال التقاط حركات وتعبيرات لبشر حقيقيين، يقرؤون النصوص في الاستوديو الخاص بها، لتدريب الصور الرمزية الخاصة بها بشكل أكثر فعالية.
سلط فيكتور ريباربيلي، الرئيس التنفيذي والمؤسس المشارك لشركة Synthesia، الضوء في بيان له على أهمية هذا التقدم: "الصور الرمزية لا تفهم ما تقوله"، وهو القيد الذي تهدف أحدث تقنياتها إلى التغلب عليه، مما يسمح باستجابة وجه أكثر واقعية لـ العواطف.
💥هذا هو. هذا يغير كل شيء. 💥
لأول مرة في التاريخ ، #AIavatars قادرون على فهم ما يقولونه.
مدعومة بنموذج الصورة الرمزية الجديد للذكاء الاصطناعي، EXPRESS-1، يمكنهم اكتشاف المشاعر الخاصة بالنص وتنفيذ جميع الفروق الدقيقة في التواصل البشري.
ال… pic.twitter.com/uj3WIjcGlm
- سينثيسيا 🎥 (synthesiaIO) 25 نيسان
لا يقتصر الابتكار على التحسين البصري والعاطفي فقط. تدعم الصور الرمزية الآن أكثر من 130 لغة، وتقدم تسميات توضيحية تلقائية، ويمكنها أيضًا نسخ أصوات المستخدمين. وعلى الرغم من أن جميع النماذج اللغوية أظهرت تقدمًا، إلا أن النموذج الإنجليزي يتميز بقربه من التعبيرات البشرية، وفقًا للاختبارات التي تم إجراؤها.
Synthesia، التي ظهرت في السوق منذ ست سنوات فقط، تحظى بالفعل بثقة نصف شركات Fortune 100 وتخدم أكثر من 55.000 شركة حول العالم، بما في ذلك أسماء مثل Zoom وXerox وMicrosoft ورويترز. ومع تزايد الطلب على حلول الذكاء الاصطناعي، شهدت الشركة الناشئة اقتراب تقييمها من مليار دولار، وهو إنجاز مثير للإعجاب للشركة وشهادة على تأثيرها على الصناعة.