Muito tem se falado sobre a IA, sobretudo quando o assunto é deepfake. Mas, outra função tem chamado atenção: os filtros vocais. Que embora não sejam necessariamente novos, estão sendo levados mais a sério com o boom da IA.
Assim como as deepfakes, os filtros vocais também possuem uma série de implicações sociais, mas também podem ter alguns impactos positivos e benefícios.
As inteligências artificiais Koe Recast e a Voice.ai, estão aprimorando rapidamente sua capacidade de transformar entradas de áudio para soar como praticamente qualquer pessoa, desde que forneçam material de origem suficiente para analisar. Em alguns casos, esses programas precisam apenas de um corte entre 15 e 30 segundos para gerar imitações convincentes.
Embora a Koe Recast esteja apenas em sua fase de teste, exemplos já estão disponíveis como de Mark Zuckerberg soando como um narrador, uma mulher e até um personagem de anime.
Segundo Asara Near, criadora da Koe Recast, o objetivo da tecnologia é ajudar as pessoas a se expressarem de qualquer maneira que as deixe mais felizes. Near ainda acrescenta que pretende lançar um aplicativo de desktop capaz de transformar as vozes dos usuários em tempo real em plataformas como Discord e Zoom.
Quando perguntada sobre o potencial ruim de usarem o Koe Recast para ataques pessoais e desinformar, Near argumentou que, “Como acontece com qualquer tecnologia, é possível que haja pontos positivos e negativos, mas acho que a grande maioria da humanidade consiste em pessoas boas e que se beneficiarão muito com isso”.
O fato é que um call center poderá IA para “apagar” o sotaque de seus terceirizados, a fim de evitar o preconceito do consumidor. Mas há casos de funcionários de uma empresa que foram vítimas de golpes, onde foram enganados por áudios fakes do seu suposto chefe.
Ao que parece estamos diante de mais um dilema sobre o uso da tecnologia, com opiniões divididas.