Como descobrir se um texto foi feito por inteligência artificial ou não?

O uso de textos gerados por inteligência artificial (IA) tem se expandido visivelmente na internet, abrangendo desde artigos e reportagens até conteúdos técnicos. A IA vem ganhando popularidade como ferramenta de produção de conteúdo em múltiplos contextos.

Ainda assim, essa tendência apresenta desafios, sobretudo no meio acadêmico, onde a autenticidade e a originalidade são essenciais. Embora os textos gerados por inteligência artificial estejam cada vez mais presentes, alguns padrões e características recorrentes podem ajudar a identificá-los.

Neste texto você encontrará:

Veja também: Profissões que vão deixar de existir por causa da Inteligência Artificial

Padrões nos textos de inteligência artificial

Abaixo estão algumas orientações para identificar padrões típicos de textos gerados por inteligência artificial:

  • Língua: Geralmente, observa-se um uso constante de clichês e expressões conhecidas, com pouca variedade no vocabulário e estruturas de frases repetitivas. Além disso, é comum encontrar erros de concordância verbal e pronominal, além de expressões idiomáticas e gírias empregadas de forma inadequada.
  • Conteúdo: Esses textos tendem a apresentar informações de caráter genérico, sem exemplos concretos ou detalhes específicos, e frequentemente recorrem a generalizações. Em muitos casos, falta um toque pessoal ou subjetivo, o que resulta em ideias pouco desenvolvidas e repetitivas.
  • Estilo: O estilo costuma ser formal e impessoal, com baixa presença de humor ou ironia. É comum o uso excessivo de termos técnicos, ausência de figuras de linguagem, como metáforas, e uma tendência a uma extensão maior que o necessário.
  • Coerência: A organização do texto pode falhar em estabelecer uma conexão clara entre parágrafos e carece de transições adequadas, levando à repetição de ideias e a uma conclusão vaga. A citação frequente de fontes externas também é um traço comum.
  • Outros Sinais: Textos de IA podem apresentar erros de digitação ou ortografia, um tom neutro sem muita variação emocional e, muitas vezes, não trazem autoria identificada ou possuem um tom excessivamente genérico.

Os detectores são confiáveis?

O desenvolvimento dos modelos de linguagem generativa, levou ao surgimento de detectores de textos gerados por IA. Contudo, a precisão desses detectores pode oscilar bastante dependendo da complexidade do texto, do idioma e da tecnologia utilizada.

Pesquisadores de Stanford analisaram sete detectores de IA e encontraram limitações principalmente ao lidar com textos de falantes nativos e não nativos de inglês. Embora os textos de falantes nativos fossem geralmente identificados corretamente, os textos de não nativos apresentaram uma alta taxa de falsos positivos, com uma média de 61,22%.

Em uma análise de 91 textos, quase todos (97,80%) foram identificados como gerados por IA por pelo menos um deles. Esse viés foi especialmente evidente em textos com baixa “perplexidade”, ou seja, com maior previsibilidade nas palavras. Para reduzir essa distorção, os pesquisadores usaram o ChatGPT para aprimorar o vocabulário dos textos de não nativos, o que resultou em uma queda de 49,45% nos falsos positivos.

Em contraste, quando textos de falantes nativos foram alterados para se assemelharem aos de não nativos, as taxas de erro cresceram, levantando preocupações éticas, sobretudo em ambientes acadêmicos. A pesquisa também mostrou que detectores baseados na métrica de “perplexidade” podem ser facilmente enganados com ajustes de linguagem, como observado em redações universitárias e resumos científicos.