O jornal The New York Times bloqueou o rastreador da Web da OpenAI, revelou o portal The Verge. Isso significa que a empresa criadora do ChatGPT não consegue mais utilizar o conteúdo do NYT para treinar seus modelos de Inteligência Artificial (IA). A restrição ocorre depois que o Times atualizou seus termos de serviço no início do mês para proibir o uso de seu conteúdo para treinar modelos de IA em geral.
Segundo o The Verge, ao visualizar a página de bloqueio para robôs do New York Times – robots.txt – é possível verificar que o Times não permite o GPTBot, rastreador que a OpenAI introduziu recentemente. “Com base no Wayback Machine do Internet Archive, parece que o NYT bloqueou o rastreador já em 17 de agosto”, afirmou o portal.
A proibição inclui tanto textos, quanto fotografias, imagens, clipes de áudio/vídeo, metadados e compilações. Os termos atualizados do Times também especificam que ferramentas automatizadas como rastreadores de sites projetados para usar, acessar ou coletar conteúdos não podem ser usados sem permissão por escrito da empresa. Tanto o NYT quanto a OpenAI não comentaram o fato, de acordo com o The Verge.
Vale lembrar que no início deste mês, várias organizações de mídia, incluindo a Associated Press, France Press e o European Publisher’s Council, assinaram uma carta aberta pedindo aos legisladores globais que adotassem regras para proteger os direitos autorais dos dados usados para treinar modelos de IA generativos.
As empresas signatárias afirmaram ainda que “essas práticas prejudicam os principais modelos de negócios da indústria da mídia” e que “além de violar a lei de direitos autorais, o impacto resultante é reduzir significativamente a diversidade da mídia e minar a viabilidade financeira das empresas para investir na cobertura da mídia, reduzindo ainda mais o acesso do público a informações confiáveis e de alta qualidade”.