Synthesia, ein britisches Unternehmen, das vom Giganten Nvidia unterstützt wird, hat gerade „Expressive Avatars“ eingeführt. Dieser Fortschritt ermöglicht es Avataren, die auf künstlicher Intelligenz (KI) basieren, menschliche Emotionen und Gesten mit beeindruckender Genauigkeit zu simulieren. Die Nachricht wurde am 25. April veröffentlicht und verspricht, die Art und Weise, wie Unternehmenspräsentationen, Marketing und Schulungen durchgeführt werden, zu verändern.
Generative KI-Technologie war bereits für ihre Fähigkeit bekannt, realistische Bilder und Bewegungen zu erzeugen. Das berüchtigtste Beispiel hierfür ist der Sora-Videogenerator von OpenAI. Allerdings standen diese Technologien vor Herausforderungen wie Hand- und Gliedmaßenverzerrungen und schlechter Lippensynchronisation. Synthesia ging diese Probleme an, indem es Bewegungen und Gesichtsausdrücke von echten Menschen erfasste, die in seinem Studio Drehbücher lasen, um seine Avatare effektiver zu trainieren.
Victor Ribarbelli, CEO und Mitbegründer von Synthesia, betonte in einer Erklärung die Bedeutung dieses Fortschritts: „Avatare verstehen nicht, was sie sagen“, eine Einschränkung, die mit der neuesten Technologie überwunden werden soll, um eine authentischere Gesichtsreaktion zu ermöglichen Emotionen.
💥Das ist es. Das verändert alles. 💥
Zum ersten Mal in der Geschichte, #AIavatars sind in der Lage zu verstehen, was sie sagen.
Mithilfe unseres neuen KI-Avatarmodells EXPRESS-1 können sie die Stimmung eines Drehbuchs erkennen und alle subtilen Nuancen der menschlichen Kommunikation ausführen.
Das… pic.twitter.com/uj3WIjcGlm
— Synthesia 🎥 (@synthesiaIO) 25. April 2024
Innovation beschränkt sich nicht nur auf die visuelle und emotionale Verbesserung. Avatare unterstützen mittlerweile über 130 Sprachen, bieten automatische Untertitel und können sogar die Stimmen der Benutzer nachbilden. Obwohl alle Sprachmodelle Fortschritte zeigten, zeichnet sich das englische Modell laut durchgeführten Tests durch seine Nähe zu menschlichen Ausdrücken aus.
Synthesia, das erst seit sechs Jahren auf dem Markt ist, genießt bereits das Vertrauen der Hälfte der Fortune 100 und bedient mehr als 55.000 Unternehmen auf der ganzen Welt, darunter Namen wie Zoom, Xerox, Microsoft und Reuters. Angesichts der wachsenden Nachfrage nach KI-Lösungen näherte sich der Wert des Startups einer Milliarde US-Dollar, ein beeindruckender Meilenstein für das Unternehmen und ein Beweis für seinen Einfluss auf die Branche.