Quem está escrevendo?

Por Daniel G. Franchini e Christian Wafo em 28 de Novembro de 2023 para o projeto: ‘IA em foco“.

Usar o suporte de Inteligência Artificial (IA) não representa um problema em si.

O filme “Blade Runner” de 1982, ambientado em um futuro distópico, explora a complexa interação entre humanos e androides altamente avançados, conhecidos como replicantes. Essa narrativa cinematográfica ressoa de maneira intrigante com os desafios contemporâneos que enfrentamos ao discernir textos produzidos por humanos e Inteligência Artificial (IA). Assim como os personagens no universo de “Blade Runner” enfrentam a difícil tarefa de distinguir entre humanos e replicantes, nós, na era da IA, nos deparamos com a crescente dificuldade de discernir se um texto foi gerado por uma mente humana ou por algoritmos avançados. A linha tênue entre a autenticidade humana e a artificialidade algorítmica é um reflexo fascinante dos dilemas explorados no filme, destacando a relevância contemporânea da ficção científica e os desafios éticos inerentes à evolução tecnológica.

No que diz respeito aos chamados “chatbots,” programas que simulam interações humanas na conversação, como o ChatGPT, Bard ou Aria, é inegável que já se tornaram uma parte integrante do nosso cotidiano. Atualmente, muitas pessoas recorrem a esses assistentes virtuais baseados em Inteligência Artificial (IA) para elaborar textos e escrever livros. Aliás, um parágrafo desta postagem foi inteiramente gerado por algoritmos. Seria possível identificar exatamente quem escreveu cada parte desta publicação, distinguindo entre a autoria humana e a gerada por chatbot? A resposta para a pergunta estará no final da página.

Tal contexto levanta a questão sobre se um programa de computador pode ser considerado autor ou coautor de obras escritas. A controvérsia está intrinsecamente ligada à atribuição de direitos de propriedade aos dados fornecidos pelos algoritmos que compõem um assistente virtual. Porém, essa é uma discussão complexa de natureza jurídica e não é o foco deste artigo.

Usar o suporte de Inteligência Artificial (IA) não representa um problema em si. Contudo, no contexto da produção científica, o auxílio de chatbots pode resultar em referências e fontes imprecisas, comprometer a originalidade do trabalho ou até mesmo levar a casos de apropriação intelectual indevida (plágio).

Portanto, é essencial constatar a interferência inapropriada de assistentes virtuais em trabalhos acadêmicos. Mas como realizar essa identificação?

Para identificar textos gerados por IA, os pesquisadores têm utilizado várias abordagens.

A Inteligência Artificial (IA) não se preocupa com a veracidade das informações que gera, mas apenas com sua plausibilidade. Assim, uma resposta pode parecer perspicaz e precisa, mas pode também ser um absurdo formulado em termos acadêmicos. Os modelos de Linguagem de Grande Porte (Large Language Model – LLM), como o ChatGPT, têm a capacidade de produzir conteúdo cada vez mais realista, mesmo que a precisão e integridade das informações em contextos científicos sejam desconhecidas.

Para identificar textos gerados por IA, os pesquisadores têm utilizado várias abordagens. Uma técnica comum envolve o uso de software para analisar diferentes características do texto, como a fluidez da leitura, a frequência de palavras específicas, padrões de pontuação e a extensão das frases. Aparentemente, tanto seres humanos quanto programas de detecção de respostas de IA conseguem identificar resumos gerados pelo ChatGPT na maioria dos casos, mas nenhum deles é um discriminador perfeito.

Os modelos LLM tendem a usar palavras comuns, como “ele”, “o (pronome)” ou “é”, em vez de escolher palavras mais incomuns. Isso contrasta com textos escritos por humanos, que frequentemente contêm erros de digitação e apresentam uma grande variabilidade, incorporando diversos estilos e jargões. Em comparação, os modelos de linguagem raramente cometem erros de digitação.

Os chatbots frequentemente apresentam padrões de resposta previsíveis

Alguns indícios podem apontar para a intervenção da Inteligência Artificial. Por exemplo, os chatbots frequentemente apresentam padrões de resposta previsíveis, podendo ser excessivamente formais ou utilizar frases e estruturas gramaticais semelhantes em todas as interações. Essa uniformidade pode sugerir que o texto foi gerado automaticamente.

Outra observação relevante é que, ocasionalmente, os humanos cometem erros gramaticais ou tipográficos, ao passo que os chatbots tendem a produzir textos bem estruturados e isentos de falhas.

Quais tecnologias estão atualmente disponíveis para identificar textos criados por Inteligência Artificial?

O conteúdo produzido por IA tem a capacidade de explorar o trabalho criativo humano e reutilizá-lo sem atribuição às fontes originais.

Existem diversas ferramentas gratuitas disponíveis para a detecção de IA. Um exemplo é o Copyleaks AI Content Detector, que utiliza algoritmos de inteligência artificial para verificar a originalidade do conteúdo. Essa ferramenta analisa se o texto fornecido por um aluno ou autor contém trechos semelhantes a outros conteúdos já existentes na internet, em bancos de dados acadêmicos e em outras fontes.

O Detecting-AI é uma solução projetada especificamente para identificar plágio em trabalhos acadêmicos, artigos e documentos. Utiliza algoritmos avançados para comparar o texto submetido com extensas bases de dados de referência. Outra opção é o Smodin, uma ferramenta avançada capaz de distinguir entre conteúdo escrito por humanos e texto gerado por ChatGPT, Bard ou outras ferramentas de IA.

Entretanto, detectores como os listados acima estão sendo contornados por ferramentas em desenvolvimento, como o Undetectable ou Quillbot, que reescrevem o conteúdo para dificultar a detecção por algumas ferramentas de IA.

Em resumo, até o momento, nenhum software de acesso aberto consegue identificar conteúdo gerado por IA com 100% de certeza.

Existem diversas ferramentas gratuitas disponíveis para a detecção de IA.

Embora não exista nenhuma ferramenta de detecção de IA totalmete precisa, as soluções disponíveis são extremamente úteis pois fornecem pistas que possibilitam análises mais minuciosas.

Aos interessados em testar um dos verificadores mencionados, recomendamos a leitura do tutorial sobre o Copyleaks AI Content Detector que se segue.

Tutorial: Copyleaks AI Content Detector

Para usar o Copyleaks AI Content Detector, siga estas etapas:

1 – Crie uma conta no Copyleaks. Você pode fazer isso visitando o site da Copyleaks (https://copyleaks.com/pt/ai-content-detector) e clicando no botão “Inscrever-se“.

2 – Faça login na sua conta e escolha o tipo de conteúdo que deseja verificar.

3 – Você pode transferir o conteúdo a partir de seu computador, de uma URL ou conta de armazenamento na nuvem.

4 – Depois de carregar o conteúdo, clique no botão “Verificar“.

O Copyleaks AI Content Detector analisará o conteúdo e gerará um relatório com os resultados. O relatório mostrará o percentual de conteúdo gerado por IA, bem como as áreas específicas do conteúdo que foram identificadas como sendo gerado por IA.

Recursos do Copyleaks AI Content Detector:

Precisão de 99,1%
Taxa de falsos positivos de 0,2%
Capacidade de detectar conteúdo gerado por IA em mais de 30 idiomas
Capacidade de detectar conteúdo gerado por IA em texto, código-fonte e imagens
Relatórios detalhados com informações sobre o percentual de conteúdo gerado por IA e as áreas específicas do conteúdo que foram identificadas como sendo gerado por IA.

Resposta ao desafio:

O primeiro parágrafo, que estabelece uma conexão entre os dilemas apresentados no filme “Blade Runner” e as questões levantadas pela era da Inteligência Artificial (IA), foi totalmente gerado pelo ChatGPT.

Referências:

SPINAK, E. IA: Como detectar textos produzidos por chatbox e seus plágios [online]. Scielo em Perspectiva, 2023 [publicado em 17 de Novembro de 2023]. Disponível em: https://blog.scielo.org/blog/2023/11/17/ia-como-detectar-textos-produzidos-por-chatbox-e-seus-plagios/
DEMERS, T. 16 of the best AI and ChatGPT content detectors compared [online]. Search Engine Land. 2023 [publicado em 25 de Abril de 2023]. Disponível em: https://searchengineland.com/ai-chatgpt-content-detectors-395957
AWAN, A.A. Top 10 Tools for Detecting ChatGPT, GPT-4, Bard, and Claude [online]. KDnuggets, 2023 [publicado em 29 de Maio de 2023]. Disponível em: https://www.kdnuggets.com/2023/05/top-10-tools-detecting-chatgpt-gpt4-bard-llms.html

Quem está escrevendo?

Olá!