Inteligência Artificial
Publicidade
Por , para o TechTudo


A OpenAI apresentou, na última sexta-feira (29), um novo software que usa inteligência artificial (IA) para transformar texto em áudio. Chamada de Voice Engine, a ferramenta é capaz de duplicar a voz de uma pessoa a partir de uma amostra de apenas 15 segundos. Por enquanto, a tecnologia está sendo testada por um grupo restrito e será lançada para o público somente quando a empresa do ChatGPT tiver estipulado medidas de segurança que impeçam falsificações de áudio. Nas linhas a seguir, entenda melhor o que é o Voice Engine e quais são seus potenciais riscos.

Conheça os riscos e benefícios do Voice Engine, a nova ferramenta da OpenAI que pode clonar a voz de qualquer pessoa — Foto: Reprodução/Canva
Conheça os riscos e benefícios do Voice Engine, a nova ferramenta da OpenAI que pode clonar a voz de qualquer pessoa — Foto: Reprodução/Canva

O que é Voice Engine?

Voice Engine é a nova ferramenta da OpenAI que consegue transformar texto em áudio. O modelo utiliza inteligência artificial para “clonar” a voz de uma pessoa a partir de uma amostra de 15 segundos. Isso significa que bastará fornecer um áudio curto para que o software consiga duplicar a voz da pessoa. Depois, será possível fazer com que a IA transforme qualquer comando de texto em uma fala natural, realista e emotiva.

Esse sintetizador de voz foi desenvolvido em 2022 e, a princípio, foi utilizado para alimentar os recursos de áudio do ChatGPT, como o Voice, o Read Aloud e também nas vozes disponíveis na API de texto para fala. Agora, a OpenAI revelou que vem testando as novas funções do Voice Engine, como a “clonagem” de voz, e já teve resultados bastante promissores.

Esse tipo de tecnologia pode ser bastante útil, ajudando pessoas não verbais em terapias, como assistente de leitura para crianças e pessoas que não sabem ler, para tradução de conteúdos audiovisuais e, até mesmo, devolvendo a voz para pessoas que sofrem com perda total ou gradativa de fala. No entanto, seu uso também pode apresentar riscos à sociedade.

IAs de voz sintéticas podem ser usadas para disseminar desinformação e aplicar golpes — Foto: Reprodução/Freepik
IAs de voz sintéticas podem ser usadas para disseminar desinformação e aplicar golpes — Foto: Reprodução/Freepik

Potenciais perigos da tecnologia

Um dos principais perigos de ferramentas que podem “clonar” a voz de uma pessoa é a tecnologia ser usada para espalhar desinformação e enganar os ouvintes. Esses softwares podem, por exemplo, criar declarações falsas usando a voz de políticos para enganar eleitores. Em outros contextos, a tecnologia também serve para aplicar golpes e, neste caso, basta que os criminosos consigam uma pequena amostra de voz da vítima – que pode ser facilmente encontrada em redes sociais – para fazer ligações para amigos e familiares pedindo dinheiro.

Em comunicado oficial, a OpenAI afirma estar muito ciente desses riscos, focando especialmente no uso prejudicial dessa ferramenta em ano eleitoral. A empresa revelou estar colaborando com parceiros de vários setores, incluindo governo, mídia, entretenimento, educação, sociedade civil, entre outros, para testar a ferramenta e passar feedbacks que irão ajudar a construir uma plataforma mais segura.

Antes de liberar o Voice Engine, a OpenAI quer implementar medidas de segurança reforçadas — Foto: Reprodução/Canva
Antes de liberar o Voice Engine, a OpenAI quer implementar medidas de segurança reforçadas — Foto: Reprodução/Canva

Algumas medidas de segurança já foram implementadas para que o Voice Engine não seja usado de forma nociva, como termos de uso que proíbem o parceiro de se passar por outro indivíduo ou organização sem consentimento ou direito legal. Outro ponto é a exigência do consentimento explícito do dono da voz e a obrigatoriedade de divulgar que as vozes geradas pelo Voice Engine foram criadas por IA.

Além disso, a empresa implementou outras medidas de segurança, como marca d'água para rastrear a origem de qualquer áudio gerado pelo Voice Engine e monitoramento de como a ferramenta está sendo usada. Os desenvolvedores também estão impedidos de projetar maneiras do usuário final conseguir criar a própria voz.

Quando ela vai estar disponível para o público?

Apesar de ser uma tecnologia muito promissora, o Voice Engine ainda não tem previsão de ser lançado para o público geral. Por entender os perigos que essa ferramenta pode apresentar, a OpenAI decidiu ter uma abordagem mais cautelosa, postergando a liberação até que consiga implementar todas as medidas de segurança possíveis para que o Voice Engine não seja usado para enganar outras pessoas.

Ao apresentá-lo oficialmente, a empresa espera abrir um diálogo sobre o uso responsável de vozes sintéticas, explicando seus benefícios e riscos, além de informar as medidas de segurança já tomadas. Por enquanto, apenas um pequeno grupo de parceiros tem acesso à ferramenta para conduzir os testes e ajudar a contornar os perigos. Com isso, a OpenAI espera tomar uma decisão mais consciente sobre a melhor forma de liberar essa tecnologia em grande escala.

Com informações de OpenAI e AP News.

Veja também: Conheça o robô que usa linguagem do ChatGPT para interagir com humanos #viral

Conheça o robô que usa linguagem do ChatGPT para interagir com humanos #viral

Conheça o robô que usa linguagem do ChatGPT para interagir com humanos #viral

Mais recente Próxima ChatGPT x Copilot? Veja diferenças, semelhanças e qual é o melhor
Mais do TechTudo