Folha processa OpenAI por uso indevido de conteúdo jornalístico

Renê Fraga
4 min de leitura

✨ Principais destaques:

  • Folha de S. Paulo acusa a OpenAI de usar seu conteúdo sem autorização para treinar modelos de IA.
  • O jornal pede indenização e a interrupção imediata do uso de suas reportagens, inclusive as protegidas por paywall.
  • O caso ecoa disputas internacionais, como a do The New York Times contra a OpenAI e a Microsoft.

A relação entre grandes veículos de imprensa e empresas de inteligência artificial acaba de ganhar mais um capítulo polêmico.

A Folha de S. Paulo entrou com uma ação judicial contra a OpenAI, criadora do ChatGPT, acusando a companhia de utilizar seu conteúdo sem autorização e sem qualquer tipo de remuneração.

Segundo o processo, a OpenAI teria acessado milhares de vezes o site do jornal para coletar reportagens, inclusive aquelas restritas a assinantes, e usado esse material tanto para treinar seus modelos de linguagem quanto para responder a usuários com resumos e até reproduções integrais de matérias.

A acusação é clara: violação de direitos autorais e concorrência desleal.

O que está em jogo: jornalismo x inteligência artificial

A Folha argumenta que a prática da OpenAI prejudica diretamente o jornalismo profissional ao oferecer gratuitamente conteúdos que deveriam estar atrás de um paywall, a empresa de IA estaria desviando leitores e assinantes, comprometendo a sustentabilidade financeira do veículo.

A advogada do jornal, Taís Gasparian, afirma que a OpenAI teria inclusive contornado barreiras técnicas criadas pela Folha para impedir a coleta de dados.

“Há uma prática nítida de concorrência desleal”, declarou.

Esse embate não é isolado. Em dezembro de 2023, o The New York Times moveu uma ação semelhante contra a OpenAI e a Microsoft, pedindo bilhões de dólares em indenização.

O jornal norte-americano também exigiu que os modelos de IA treinados com seu conteúdo fossem destruídos.

Evidências apresentadas pela Folha

Nos documentos anexados ao processo, a Folha mostra que:

  • Em julho de 2025, mais de 45 mil acessos ao site foram feitos por bots da OpenAI.
  • O domínio da Folha aparece em listas de dados usados para treinar o ChatGPT, hospedado dentro do provedor UOL.
  • O jornal O Globo também aparece como fonte de treinamento.
  • Há exemplos concretos de respostas do ChatGPT que reproduzem reportagens completas, inclusive de acesso restrito.

Essas evidências reforçam a tese de que o jornal foi usado como fonte sistemática de dados, sem qualquer tipo de acordo ou compensação financeira.

O impacto para o futuro da imprensa e da IA

A ação da Folha pede uma decisão liminar para que a OpenAI interrompa imediatamente o uso de seu conteúdo. O valor da indenização ainda será definido.

Para os advogados do jornal, a questão vai além de um simples conflito jurídico: trata-se da sobrevivência da imprensa em um cenário cada vez mais dominado por big techs.

“A OpenAI se aproveita de todos os investimentos que a Folha faz para produzir notícias atuais e confiáveis, sem dar nada em troca”, afirmou Gasparian.

O tema também está em debate no Congresso Nacional, por meio do Projeto de Lei 2.338, que prevê pagamento de direitos autorais pelo uso de conteúdo protegido em treinamentos de IA.

A OpenAI, no entanto, já se posicionou contra a proposta.

Em entrevista recente, Nicolas Robinson Andrade, diretor da empresa para a América Latina, comparou a cobrança de direitos autorais a um “imposto sobre cadeiras”, sugerindo que isso poderia afastar investimentos do Brasil.

Seguir:
Renê Fraga é fundador e editor-chefe do Eurisko, ecossistema editorial independente dedicado à inteligência artificial, código aberto, tecnologia e cultura digital. Atuando com projetos online desde 1996, escreve há mais de 20 anos sobre tecnologia e inovação, acompanhando a evolução da internet e o impacto das novas tecnologias na forma como vivemos, trabalhamos e pensamos.
Nenhum comentário