Na era digital em que vivemos, as evoluções tecnológicas são constantes. Um dos avanços mais recentes foi anunciado pela OpenAI em 25 de setembro, quando a empresa divulgou que o ChatGPT terá capacidade de reconhecer imagens e voz, marcando mais um passo significativo na interação entre seres humanos e máquinas.
Os entusiastas de tecnologia e criptos poderão contar em breve com a habilidade do ChatGPT de receber comandos por voz. Isso porque a OpenAI incorporou um modelo de texto para voz que produz áudio a partir de pequenas amostras criadas por atores de voz profissionais. Além disso, o Whisper, um sistema de reconhecimento de voz de código aberto da empresa, também está potencializando essa nova funcionalidade.
As aplicações dessa nova ferramenta são amplas: desde auxiliar na leitura de histórias antes de dormir, passando pela criação de receitas, até a elaboração de discursos e a explicação de expressões populares.
E não é só a voz que o ChatGPT vai compreender. A possibilidade de interpretar imagens ou partes específicas delas foi outro grande anúncio. Contudo, os desafios envolvendo a privacidade das imagens não foram ignorados pela OpenAI. A empresa foi transparente em mencionar que a precisão do ChatGPT não é infalível. Ainda assim, suas descrições gerais sobre imagens são úteis, um exemplo disso é a colaboração anterior da OpenAI com o app Be My Eyes, desenvolvido para auxiliar pessoas cegas ou com baixa visão.
É claro que inovações dessa magnitude não vêm sem preocupações. A OpenAI está ciente dos riscos de fraude e personificação, por isso, decidiu limitar as funcionalidades de voz à sua plataforma de chat. A ênfase foi dada ao fato de que os áudios são gerados por profissionais, e não por usuários. Uma curiosidade: o Spotify, por exemplo, já está utilizando essa funcionalidade para traduzir podcasts participantes para diferentes idiomas.
Os usuários do ChatGPT Plus e Enterprise serão os primeiros a experimentar essas inovações nas próximas semanas, enquanto as funcionalidades de voz estarão disponíveis para iOS e Android, mediante aceitação dos usuários, e a função de reconhecimento de imagens estará disponível em todas as plataformas.