A OpenAI apresentou, na última sexta-feira (29), um novo software que usa inteligência artificial (IA) para transformar texto em áudio. Chamada de Voice Engine, a ferramenta é capaz de duplicar a voz de uma pessoa a partir de uma amostra de apenas 15 segundos. Por enquanto, a tecnologia está sendo testada por um grupo restrito e será lançada para o público somente quando a empresa do ChatGPT tiver estipulado medidas de segurança que impeçam falsificações de áudio. Nas linhas a seguir, entenda melhor o que é o Voice Engine e quais são seus potenciais riscos.
🔎 Chega de mentiras? IA promete detectar inverdades com 84% de precisão
🔔 Canal do TechTudo no WhatsApp: acompanhe as principais notícias, tutoriais e reviews
![Conheça os riscos e benefícios do Voice Engine, a nova ferramenta da OpenAI que pode clonar a voz de qualquer pessoa — Foto: Reprodução/Canva](https://s2-techtudo.glbimg.com/NST1Zsy-sA0Gqk49fWTc5Ttd3Bo=/0x0:1600x900/984x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2023/b/R/dcvA4xSEyFy9lcIa0deQ/nadeem-sarwarslashgea-8-.png)
📝 Quais são os chatbots mais inteligentes para conversar com IA? Comente no Fórum do TechTudo
O que é Voice Engine?
Voice Engine é a nova ferramenta da OpenAI que consegue transformar texto em áudio. O modelo utiliza inteligência artificial para “clonar” a voz de uma pessoa a partir de uma amostra de 15 segundos. Isso significa que bastará fornecer um áudio curto para que o software consiga duplicar a voz da pessoa. Depois, será possível fazer com que a IA transforme qualquer comando de texto em uma fala natural, realista e emotiva.
Esse sintetizador de voz foi desenvolvido em 2022 e, a princípio, foi utilizado para alimentar os recursos de áudio do ChatGPT, como o Voice, o Read Aloud e também nas vozes disponíveis na API de texto para fala. Agora, a OpenAI revelou que vem testando as novas funções do Voice Engine, como a “clonagem” de voz, e já teve resultados bastante promissores.
Esse tipo de tecnologia pode ser bastante útil, ajudando pessoas não verbais em terapias, como assistente de leitura para crianças e pessoas que não sabem ler, para tradução de conteúdos audiovisuais e, até mesmo, devolvendo a voz para pessoas que sofrem com perda total ou gradativa de fala. No entanto, seu uso também pode apresentar riscos à sociedade.
![IAs de voz sintéticas podem ser usadas para disseminar desinformação e aplicar golpes — Foto: Reprodução/Freepik](https://s2-techtudo.glbimg.com/ApO-B25C4cL0puM2dT8iuiDbvTU=/0x0:888x500/984x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2024/2/n/conihPRee0DMtydmZNyQ/cpa.png)
Potenciais perigos da tecnologia
Um dos principais perigos de ferramentas que podem “clonar” a voz de uma pessoa é a tecnologia ser usada para espalhar desinformação e enganar os ouvintes. Esses softwares podem, por exemplo, criar declarações falsas usando a voz de políticos para enganar eleitores. Em outros contextos, a tecnologia também serve para aplicar golpes e, neste caso, basta que os criminosos consigam uma pequena amostra de voz da vítima – que pode ser facilmente encontrada em redes sociais – para fazer ligações para amigos e familiares pedindo dinheiro.
Em comunicado oficial, a OpenAI afirma estar muito ciente desses riscos, focando especialmente no uso prejudicial dessa ferramenta em ano eleitoral. A empresa revelou estar colaborando com parceiros de vários setores, incluindo governo, mídia, entretenimento, educação, sociedade civil, entre outros, para testar a ferramenta e passar feedbacks que irão ajudar a construir uma plataforma mais segura.
![Antes de liberar o Voice Engine, a OpenAI quer implementar medidas de segurança reforçadas — Foto: Reprodução/Canva](https://s2-techtudo.glbimg.com/tHygQlt6_U0qlHSa4nIO80QQpzQ=/0x0:1600x900/984x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2023/Q/M/B94r34TIucX5huhkQjiQ/nadeem-sarwarslashgea-10-.png)
Algumas medidas de segurança já foram implementadas para que o Voice Engine não seja usado de forma nociva, como termos de uso que proíbem o parceiro de se passar por outro indivíduo ou organização sem consentimento ou direito legal. Outro ponto é a exigência do consentimento explícito do dono da voz e a obrigatoriedade de divulgar que as vozes geradas pelo Voice Engine foram criadas por IA.
Além disso, a empresa implementou outras medidas de segurança, como marca d'água para rastrear a origem de qualquer áudio gerado pelo Voice Engine e monitoramento de como a ferramenta está sendo usada. Os desenvolvedores também estão impedidos de projetar maneiras do usuário final conseguir criar a própria voz.
Quando ela vai estar disponível para o público?
Apesar de ser uma tecnologia muito promissora, o Voice Engine ainda não tem previsão de ser lançado para o público geral. Por entender os perigos que essa ferramenta pode apresentar, a OpenAI decidiu ter uma abordagem mais cautelosa, postergando a liberação até que consiga implementar todas as medidas de segurança possíveis para que o Voice Engine não seja usado para enganar outras pessoas.
Ao apresentá-lo oficialmente, a empresa espera abrir um diálogo sobre o uso responsável de vozes sintéticas, explicando seus benefícios e riscos, além de informar as medidas de segurança já tomadas. Por enquanto, apenas um pequeno grupo de parceiros tem acesso à ferramenta para conduzir os testes e ajudar a contornar os perigos. Com isso, a OpenAI espera tomar uma decisão mais consciente sobre a melhor forma de liberar essa tecnologia em grande escala.
Veja também: Conheça o robô que usa linguagem do ChatGPT para interagir com humanos #viral
![Conheça o robô que usa linguagem do ChatGPT para interagir com humanos #viral Conheça o robô que usa linguagem do ChatGPT para interagir com humanos #viral](https://s04.video.glbimg.com/x240/12454759.jpg)
Conheça o robô que usa linguagem do ChatGPT para interagir com humanos #viral