Reddit processa Perplexity e mais três empresas por uso indevido de conteúdo sem licença

O Reddit entrou com um novo processo contra a Perplexity e outras três empresas por uso não autorizado de dados da plataforma. Entenda o caso, o impacto para o setor de IA e como a gigante das comunidades online está protegendo seu conteúdo.

10/22/20253 min read

Reddit intensifica a guerra contra o uso indevido de seus dados

O Reddit iniciou uma nova batalha judicial contra empresas que estariam utilizando seu conteúdo sem pagar por isso.
De acordo com o The New York Times, a rede social processou Perplexity, SerApi, OxyLabs e AWMProxy, alegando que essas companhias rasparam (scrapearam) dados de resultados de busca e os utilizaram sem qualquer tipo de licença.

⚖️ A ação busca indenização financeira e uma injunção permanente que impeça as empresas de continuar vendendo ou reutilizando material extraído ilegalmente da plataforma.

O que motivou o processo do Reddit

Desde 2023, o Reddit passou a cobrar pelo acesso a seus dados, especialmente para empresas que desejam usar o conteúdo da comunidade em treinamento de inteligência artificial.
A plataforma também firmou acordos de licenciamento com Google e OpenAI, além de desenvolver seu próprio sistema de respostas por IA, que utiliza o conhecimento presente nas postagens dos usuários.

No entanto, segundo o Reddit, algumas empresas têm contornado essas cobranças ao extrair conteúdo diretamente dos resultados de busca, o que viola os novos termos de uso de dados da companhia.

🔍 Por isso, o Reddit agora busca compensações financeiras e uma decisão judicial que proíba o uso de conteúdo raspado anteriormente.

Perplexity é o alvo principal das acusações

Entre os nomes citados no processo, o destaque é a Perplexity, startup de inteligência artificial que já foi acusada de copiar e reproduzir conteúdo sem pagar licenciamento.
A empresa também teria ignorado o protocolo robots.txt, que serve justamente para informar quais páginas um site não permite que sejam raspadas por bots ou crawlers.

De acordo com a ação, o Reddit teria conseguido provar o uso indevido criando uma postagem de teste que só poderia ser acessada pelo mecanismo de busca do Google — ou seja, nenhum outro sistema teria acesso a ela.
Poucas horas depois, o conteúdo apareceu nas respostas geradas pelo chatbot da Perplexity, confirmando a origem indevida. 🤖

“A única forma de a Perplexity ter obtido aquele conteúdo seria por meio da raspagem dos resultados do Google e incorporação imediata em seu mecanismo de respostas”, diz o processo.

A resposta da Perplexity

Em nota enviada à imprensa, a Perplexity declarou ainda não ter recebido oficialmente o processo, mas afirmou que pretende “defender vigorosamente o direito dos usuários de acessar o conhecimento público de forma livre e justa”.
A empresa reforçou que seu trabalho com IA é “ético, responsável e focado em fornecer respostas precisas”, destacando que não tolerará “ameaças contra a abertura e o interesse público”.

A postura agressiva do Reddit na defesa de seus dados

Este processo se soma a uma série de medidas recentes do Reddit para controlar o acesso de bots e web crawlers à plataforma.
Em 2024, a empresa passou a limitar o tráfego de rastreadores não identificados e, em agosto de 2025, restringiu o acesso do Internet Archive (Wayback Machine) ao seu conteúdo.

Além disso, o Reddit adotou o padrão “Really Simple Licensing”, que adiciona termos de licenciamento diretamente ao arquivo robots.txt, reforçando o controle sobre como seus dados podem ser usados.

💡 A mensagem é clara: o Reddit quer controlar quem usa seus dados e garantir compensação justa em um cenário onde empresas de IA dependem cada vez mais de grandes volumes de informação pública para treinar seus modelos.

O que o caso revela sobre o futuro da IA e dos direitos de dados

A disputa entre Reddit e Perplexity simboliza um conflito crescente entre criadores de conteúdo e empresas de inteligência artificial.
Com o aumento das regulações e o foco em uso ético de dados, casos como esse devem se tornar cada vez mais frequentes — especialmente à medida que grandes plataformas buscam monetizar o acesso às suas comunidades e postagens.

🌐 No fim das contas, o processo do Reddit pode definir novos padrões legais sobre o uso de conteúdo público na era da IA — e impactar diretamente o modo como empresas de tecnologia coletam e utilizam dados da internet.