Synthesia 是一家由巨頭 Nvidia 支持的英國公司,剛剛推出了「Expressive Avatars」。這項進步使得基於人工智慧 (AI) 的化身能夠以令人印象深刻的準確性模擬人類情緒和手勢。這項新功能於 25 月 XNUMX 日發布,預計將改變企業展示、行銷和培訓的方式。
生成式人工智慧技術因其創建逼真圖像和動作的能力而聞名。最臭名昭著的例子是 OpenAI 的 Sora 視訊生成器。然而,這些技術面臨著手部和肢體扭曲以及口型同步不佳等挑戰。 Synthesia 透過捕捉真實人物的動作和表情來解決這些問題,真實人物在其工作室中閱讀腳本,以更有效地訓練其化身。
Synthesia 執行長兼聯合創始人Victor Ribarbelli 在一份聲明中強調了這一進步的重要性:“化身不明白他們在說什麼”,這是其最新技術旨在克服的一個限制,允許更真實的面部反應情緒。
💥就是這個了。這改變了一切。 💥
有史以來第一次, #AI頭像 能夠理解他們在說什麼。
在我們新的 AI 化身模型 EXPRESS-1 的支持下,它們可以偵測腳本的情緒並執行人類溝通的所有細微差別。
該... pic.twitter.com/uj3WIjcGlm
— Synthesia 🎥 (@synthesiaIO) 2024 年 4 月 25 日
創新不僅限於視覺和情感的增強。頭像現在支援 130 多種語言,提供自動字幕,甚至可以複製用戶的聲音。儘管所有語言模型都顯示出進步,但根據進行的測試,英語模型因其接近人類表達而脫穎而出。
Synthesia 上市僅六年,已受到一半財富 100 強企業的信賴,為全球超過 55.000 家公司提供服務,其中包括 Zoom、Xerox、微軟和路透社等公司。隨著對人工智慧解決方案的需求不斷增長,這家新創公司的估值接近 1 億美元,這對公司來說是一個令人印象深刻的里程碑,也證明了其對該行業的影響。