Sou Aluno
Formações
Imersões
Eventos
AI Tools
Artigos
Sobre Nós
Para Empresas

Folha de S.Paulo x OpenAI: uma análise ponto a ponto de tudo o que você precisa saber

O caso pode se tornar um marco regulatório sobre o uso de IA e direitos autorais no país

Folha de S.Paulo x OpenAI: uma análise ponto a ponto de tudo o que você precisa saber

O ChatGPT no banco dos réus

, redator(a) da StartSe

9 min

26 ago 2025

Atualizado: 26 ago 2025

newsletter

Start Seu dia:
A Newsletter do AGORA!

A disputa judicial entre a Folha de S.Paulo e a OpenAI não é apenas mais um caso de direitos autorais: é um choque direto entre o modelo tradicional de produção jornalística e a lógica das big techs que expandem suas inteligências artificiais a partir de dados disponíveis online. 

Pela primeira vez no Brasil, um grande veículo de mídia coloca no banco dos réus a criadora do ChatGPT, acusando-a de usar seu conteúdo sem autorização e sem remuneração.

O processo traz provas técnicas, capturas de tela, registros em atas notariais e exemplos práticos de como o ChatGPT reproduz e resume reportagens do jornal, inclusive driblando o paywall que sustenta financeiramente o modelo de negócios da empresa. 

A seguir, detalhamos os pontos centrais dessa batalha para você ficar por dentro de um dos assuntos que pode redefinir o escopo de atuação de uma das principais ferramentas de Inteligência Artificial daqui em diante.

O que alega a Folha de S.Paulo

A Folha sustenta que a OpenAI:

  • Treinou o ChatGPT com base no acervo jornalístico do jornal (reportagens, colunas, análises e até conteúdo fechado), sem autorização;
     
  • Distribui sistematicamente esse conteúdo para seus usuários, por meio de resumos e transcrições, inclusive de textos disponíveis apenas a assinantes;
     
  • Com isso, pratica violação de direitos autoraisconcorrência desleal, já que monetiza sua ferramenta sem arcar com os custos de produção jornalística;
     
  • Enfraquece o modelo de negócios da imprensa, que depende do acesso direto ao site e das assinaturas digitais.
     

Segundo a ação, trata-se de uma estratégia típica das big techs: crescer exponencialmente sua audiência com base em conteúdos de terceiros, para depois consolidar um monopólio de atenção e explorar esse ativo comercialmente.

Quais as provas a Folha de S.Paulo traz no processo

A peça processual é rica em provas técnicas e visuais. Entre elas:

  1. Repositório da OpenAI no GitHub: a Folha anexou capturas de tela do repositório “GPT-2” no GitHub, mantido oficialmente pela OpenAI, em que aparecem listas de domínios usados para treinamento do modelo. O domínio “UOL” (hospedagem da Folha) aparece com quase 20 mil referências — indício claro de que o conteúdo do jornal foi incorporado ao dataset “WebText”.
     
  2. Listas de colaboradores no GitHub e LinkedIn: as capturas mostram nomes de engenheiros vinculados ao repositório, confirmando vínculos profissionais com a OpenAI.
     
  3. Arquivos técnicos (“model_card.md”): trechos dos documentos descrevem como o conjunto de dados de 45 milhões de links da internet foi utilizado no treinamento, incluindo explicitamente domínios ligados à Folha.
     
  4. Atas notariais (24 e 30/07/2025): registraram o acesso e cópia desses repositórios públicos, garantindo validade jurídica das provas coletadas.
     
  5. Registros de servidores da Folha: apenas em julho de 2025, dois dos 12 servidores do jornal registraram mais de 482 mil acessos de bots da OpenAI — sendo mais de 45 mil feitos por GPTBots, cuja finalidade declarada é o treinamento de modelos.
     
  6. Exemplos de uso pelo ChatGPT: a Folha apresenta diálogos em que o ChatGPT é instruído a resumir ou listar informações de matérias da Folha. O sistema retorna:

    • Resumos fiéis de reportagens, com citação explícita ao jornal como fonte;
    • Listagem de cinco matérias jornalísticas, resumidas em sequência;
    • Possibilidade de contornar o paywall, entregando gratuitamente conteúdos reservados a assinantes.
       

Esses exemplos foram capturados em imagens anexadas à petição, evidenciando que o chatbot atua como um “atalho” que dispensa o acesso ao site da Folha.

O que pede a Folha de S.Paulo ao juízo

Os pedidos do jornal são amplos e contundentes:

  1. Abstenção imediata: que a OpenAI seja proibida de coletar e explorar conteúdos da Folha, tanto para treinar modelos quanto para entregar respostas aos usuários;
     
  2. Indenização por perdas e danos: pelos usos passados sem autorização, fundamentada no Código Civil, Lei de Direitos Autorais e Lei de Propriedade Industrial;
     
  3. Destruição dos modelos treinados: uma das medidas mais drásticas do processo, com base no artigo 106 da Lei de Direitos Autorais, exigindo que a OpenAI elimine modelos de IA treinados com conteúdo da Folha;
     
  4. Transparência: que a empresa apresente dados completos sobre como os conteúdos foram coletados e utilizados.

O que o juízo decidiu até então

O juiz analisou o pedido de tutela antecipada. A decisão foi parcial:

  • Determinou que a OpenAI preserve documentos e registros relativos ao treinamento e uso de conteúdos da Folha;
     
  • Reconheceu a plausibilidade das alegações, mas não suspendeu o funcionamento do ChatGPT nem ordenou a destruição dos modelos imediatamente;
     
  • Sinalizou que a instrução probatória será essencial, dado o caráter técnico e inovador da disputa.

Em outras palavras: a Justiça optou por uma postura cautelosa, garantindo a coleta de provas antes de qualquer medida de impacto irreversível.

Quais os passos de agora em diante

O processo entra em fase de contestação da OpenAI, que deverá apresentar sua defesa técnica e jurídica. É esperado que a empresa levante argumentos de:

  • uso justo (fair use), ainda que o conceito seja do direito norte-americano e não esteja positivado da mesma forma no Brasil;
     
  • interesse público, alegando que a disponibilização de informação amplia o acesso ao conhecimento;
     
  • impossibilidade técnica de “destruir” modelos já treinados, dada a natureza do aprendizado de máquina.

Depois, virão a instrução probatória e eventuais perícias técnicas para confirmar se, de fato, os conteúdos da Folha foram usados no treinamento. Caso o pedido de destruição dos modelos prospere, o impacto seria mundial — dado que a OpenAI opera globalmente.

No horizonte, o caso pode se tornar um marco regulatório: se a Justiça brasileira reconhecer o uso indevido, será um precedente para que outros veículos de imprensa — e até criadores de conteúdo individuais — cobrem compensações financeiras das big techs que utilizam dados para treinar inteligências artificiais.

Esse processo não é só jurídico: é estratégico. Ele questiona se o futuro da IA pode se sustentar sem remunerar quem produz informação original. Para líderes empresariais, é um alerta: a regulação da IA será construída em tribunais, e pode remodelar todo o mercado digital.

O assunto é INEVITÁVEL. E certamente estará presente nas discussões do AI Festival, que a StartSe promove em São Paulo, nos dias 15 e 16 de outubro. 

Vamos acompanhar de perto o caso e seguir trazendo análises e novidades.

Gostou deste conteúdo? Deixa que a gente te avisa quando surgirem assuntos relacionados!


Assuntos relacionados

Imagem de perfil do redator

Jornalista e Copywriter. Escreve sobre negócios, tendências de mercado e tecnologia na StartSe.

Leia o próximo artigo

newsletter

Start Seu dia:
A Newsletter do AGORA!