Com o avanço dos modelos de inteligência artificial (IA), está cada vez mais difícil distinguir se um texto foi escrito por uma máquina ou por um ser humano. Para enfrentar esse desafio, um professor da Universidade da Flórida (UF), nos Estados Unidos, está desenvolvendo uma ferramenta inovadora capaz de identificar conteúdos gerados por IA, mesmo quando alterados ou parafraseados.
A tecnologia consiste em uma marca d’água invisível, que será aplicada aos textos criados por grandes modelos de linguagem (LLM, na sigla em inglês). A ferramenta, atualmente em fase de testes no supercomputador HiPerGator da UF, visa identificar conteúdos produzidos por IA, mesmo após modificações.
“Se sou estudante e escrevo minha tarefa com o ChatGPT, não quero que meu professor perceba isso”, afirmou Yuheng Bu, professor assistente no Departamento de Engenharia Elétrica e de Computação da Faculdade de Engenharia Herbert Wertheim.
Em um estudo recente, realizado por pesquisadores da Universidade de Reading, no Reino Unido, foi demonstrado o quanto é difícil detectar textos gerados por IA. Criando perfis falsos de estudantes, os pesquisadores usaram ferramentas de IA para escrever tarefas e, em seguida, tentaram identificar a origem dos textos. O estudo revelou que 94% das submissões feitas por IA não foram detectadas, evidenciando a dificuldade de rastrear esse tipo de conteúdo no mundo real.
A nova tecnologia da UF foca em dois pontos principais: garantir que a qualidade do texto gerado pelo LLM não seja comprometida após a aplicação da marca d’água e assegurar que o sistema seja resistente a modificações, permanecendo invisível para os leitores humanos. Mesmo que o texto seja reescrito, com sinônimos ou paráfrases, a marca d’água continuará detectável, desde que o significado original seja preservado.
Em 2023, o Google DeepMind também lançou uma tecnologia de marca d’água para detectar textos gerados por IA. Porém, Bu destaca que a solução da UF se diferencia por aplicar a marca d’água a apenas uma parte do texto durante sua geração, o que garante maior qualidade e resistência contra tentativas de remoção.
O maior desafio agora é tornar a chave de detecção acessível ao público. “A entidade que aplica a marca d’água também possui a chave necessária para a detecção. Se o ChatGPT marcar um texto, a OpenAI teria a chave correspondente para verificá-lo”, explicou Bu.
O próximo passo será criar um ecossistema para garantir o uso da marca d’água e a distribuição das chaves de verificação, ou desenvolver técnicas que não dependam de chaves secretas.
Fonte: Olhar Digital