O ArXiv, principal repositório global de preprints científicos mantido pela Universidade Cornell e infraestrutura central para a disseminação de pesquisas em física e ciência da computação, prepara medidas mais duras contra o uso não supervisionado de inteligência artificial. Segundo reportagem do TechCrunch, a plataforma planeja aplicar suspensões de um ano a autores que submeterem artigos gerados integralmente por grandes modelos de linguagem (LLMs) sem a devida revisão humana. A iniciativa marca uma resposta institucional direta à crescente submissão de trabalhos que evidenciam o uso descuidado de ferramentas generativas. O movimento sinaliza uma tentativa de estabelecer limites claros de responsabilização autoral em um ecossistema acadêmico cada vez mais permeado por automação.
A integridade do preprint na era generativa
A decisão reportada ilustra um desafio estrutural para plataformas de distribuição científica aberta. Como um repositório que publica artigos antes da revisão formal por pares (peer review), o ArXiv historicamente depende de uma moderação inicial leve e da confiança na comunidade de pesquisa para manter a qualidade e a relevância de seu acervo. A proliferação de modelos generativos introduziu um vetor de ruído em escala inédita, permitindo a produção rápida de textos que, embora sintaticamente corretos e formatados nos padrões acadêmicos, podem carecer de rigor metodológico ou conter alucinações factuais indetectáveis em uma triagem superficial.
Ao estabelecer uma penalidade severa como o banimento temporário de doze meses, a plataforma indica que não pretende proibir o uso da inteligência artificial como ferramenta de assistência, mas sim coibir a delegação total da autoria. A política reflete uma distinção que começa a se consolidar nas diretrizes editoriais de grandes publicações científicas: a aceitação da IA para refinamento de código, estruturação de dados ou tradução, em contraste com a rejeição de seu uso como gerador primário de hipóteses e conclusões. A eficácia da medida, contudo, dependerá da capacidade técnica do repositório de detectar com precisão o texto sintético sem penalizar falsos positivos, um problema ainda não resolvido pela indústria de tecnologia.
A postura do repositório antecipa debates regulatórios que devem se estender a periódicos tradicionais, universidades e conferências acadêmicas de primeira linha nos próximos meses. A forma como as instituições de pesquisa equilibrarão o ganho de eficiência das ferramentas generativas com a exigência inegociável de supervisão humana continuará a ditar os novos padrões de publicação científica.
Com reportagem de Brazil Valley
Source · TechCrunch





