Responsible AI Platform

Reddit vs AP: wat de rechterlijke uitspraak betekent voor AI-trainingsdata

··7 min leestijd

Update 4 maart 2026: De Rechtbank Den Haag wees alle vorderingen van Reddit af. Het AP-onderzoek naar de rechtmatigheid van het verkopen van gebruikersdata aan AI-trainers loopt ongehinderd door.

Op 4 maart 2026 deed de Rechtbank Den Haag uitspraak in een kort geding dat Reddit had aangespannen tegen de Autoriteit Persoonsgegevens. Het resultaat was ondubbelzinnig: alle vorderingen afgewezen. Het onderzoek gaat door. En voor iedereen die in de AI-industrie actief is met grote hoeveelheden tekstdata, is dat een signaal dat serieus genomen moet worden.

Hoe dit begon

Miljoenen mensen hebben in de loop der jaren bijgedragen aan Reddit. Ze stelden vragen, deelden ervaringen, schreven verhalen en debatteerden over van alles en nog wat. Die tekst vormt samen een van de rijkste corpora aan menselijke expressie op het internet - en in 2023 besloot Reddit daar commercieel voordeel uit te halen. Het platform kondigde aan de toegang tot zijn API te beperken en te monetariseren, specifiek gericht op bedrijven die de data willen gebruiken voor het trainen van grote taalmodellen.

De Autoriteit Persoonsgegevens opende in 2025 een onderzoek naar deze praktijk. De centrale vraag: mogen platforms als Reddit de door gebruikers gegenereerde content verkopen aan AI-bedrijven, zonder dat die gebruikers daarvoor toestemming hebben gegeven?

Reddit heeft zijn Europese kantoor in Nederland. Daarmee is de AP bevoegde toezichthouder.

De weigering die tot de rechtszaak leidde

Een onderzoek verloopt vlot zolang de onderzochte partij meewerkt. Dat deed Reddit niet. Het bedrijf weigerde de AP toegang te geven tot interne systemen - Jira voor projectmanagement, Google Vault voor gearchiveerde communicatie, Ironclad voor contractbeheer, en zogeheten SWAT-tabellen met interne data-analyses. De reden die Reddit opgaf was het juridisch verschoningsrecht, ook bekend als attorney-client privilege: de informatie zou onder de bescherming van de vertrouwelijke advocaat-cliëntrelatie vallen.

De AP was het daar fundamenteel niet mee eens en legde een last onder dwangsom op. Reddit koos voor de rechter.

Wat de rechter besliste

De Rechtbank Den Haag was helder. Alle vorderingen van Reddit werden afgewezen. De rechter zag geen grond om de AP te verbieden het onderzoek voort te zetten, noch om de dwangsom te schorsen.

Het vonnis (ECLI:NL:RBDHA:2026:4248) is procedureel van aard: het stelt niet vast dat Reddit de AVG heeft overtreden, maar het ruimt alle formele obstakels uit de weg voor de AP om dat nu zelf vast te stellen. Reddit heeft zijn juridische blokkade geprobeerd en verloren.

De juridische kern: mag dit eigenlijk?

De vraag die het AP-onderzoek uiteindelijk moet beantwoorden, raakt de hele AI-industrie. Wanneer een platform gebruikersdata verkoopt aan AI-ontwikkelaars voor het trainen van taalmodellen, is dat dan rechtmatig onder de AVG?

Verwerking van persoonsgegevens vereist een grondslag. Reddit zal waarschijnlijk een beroep doen op gerechtvaardigd belang (artikel 6, lid 1, sub f AVG). Maar die grondslag vereist een afweging: het belang van de verwerkingsverantwoordelijke moet worden afgewogen tegen de belangen, rechten en vrijheden van de betrokkenen. En daar wringt het.

Iemand die een vraag stelt op een subreddit over koken, of een persoonlijk verhaal deelt in een discussie over mentale gezondheid, zal redelijkerwijs niet hebben verwacht dat die bijdrage jaren later wordt gebruikt als trainingsmateriaal voor commercieel aangeboden AI-systemen. De verwachting van de gebruiker op het moment van plaatsen is relevant voor de beoordeling van het gerechtvaardigd belang.

Dan is er het doelbindingsbeginsel. Data die is verzameld voor het faciliteren van online discussies, mag in beginsel niet worden hergebruikt voor een wezenlijk ander doel, tenzij daarvoor opnieuw een geldige grondslag bestaat. Het ter beschikking stellen aan AI-bedrijven voor modeltraining is een fundamenteel ander doel dan het faciliteren van community-discussie.

En tot slot zijn er de rechten van betrokkenen zelf. Inzage, bezwaar, verwijdering - die rechten bestaan op papier, maar zijn in de praktijk nauwelijks uitoefenbaar op het moment dat de data al is overgedragen aan een derde partij voor training. Eenmaal ingebakken in een model, is het vrijwel onmogelijk om een individuele bijdrage er weer uit te halen.

AI Act artikel 53: transparantie over trainingsdata

Naast de AVG speelt ook de AI Act een rol, in het bijzonder voor zogenoemde general-purpose AI-modellen (GPAI). Artikel 53 van de AI Act verplicht aanbieders van GPAI-modellen om transparantie te bieden over de data die is gebruikt voor training, inclusief een publieke samenvatting van de gebruikte datasets.

Dit creëert een aantrekkelijke keten van verantwoordelijkheid. Als een AI-bedrijf data heeft ingekocht van Reddit, moet het dat kunnen verantwoorden in zijn trainingsdatadocumentatie. En Reddit als dataleverancier moet kunnen aantonen dat die verkoop rechtmatig was. Op het moment dat de AP vaststelt dat dat niet zo is, heeft zowel de data-verkoper als de AI-ontwikkelaar een probleem.

Het is precies dat mechanisme dat dit onderzoek zo relevant maakt voor de bredere markt. Het gaat niet alleen om Reddit. Het gaat om alle platforms die hun data-activa willen monetariseren via API-deals met AI-bedrijven, en om alle AI-aanbieders die op die data bouwen.

Wat dit betekent voor RAG-pipelines en API-data

Veel organisaties bouwen vandaag de dag RAG-systemen (Retrieval-Augmented Generation) op basis van externe databronnen. Ze scraapen publiek beschikbare content, kopen API-toegang bij sociale platforms, of gebruiken datasets van derde partijen. Dit onderzoek stelt een indringende vraag die te weinig wordt gesteld: is die data eigenlijk juridisch schoon?

"Publiek beschikbaar" is niet hetzelfde als "vrij te gebruiken voor elk doel". Reddit-posts zijn publiek zichtbaar, maar de personen die ze hebben geschreven zijn identificeerbaar, hebben grondrechten, en hebben hun bijdrage gedaan in een specifieke context. Het gebruik van die data voor commerciële AI-training doorbreekt die context.

Organisaties die externe data inzetten in AI-toepassingen, doen er verstandig aan vier vragen serieus te nemen. Ten eerste: op welke grondslag is die data oorspronkelijk verzameld, en is die grondslag gedocumenteerd? Ten tweede: is er een geldig argument voor doelbinding - past het nieuwe gebruik binnen de redelijke verwachting van de betrokkenen? Ten derde: bevat de overeenkomst met de dataleverancier garanties over de rechtmatigheid van de data? En ten vierde: zijn betrokkenen geïnformeerd en hebben ze een reële mogelijkheid gehad om bezwaar te maken?

Als het AP-onderzoek uitwijst dat Reddit's datapraktijken onrechtmatig zijn, dan worden ook de AI-modellen die op die data zijn getraind juridisch minder stevig gefundeerd. Dat heeft consequenties voor iedere organisatie die die modellen inzet.

De bredere signaalwaarde

De zaak Reddit vs AP is geen incident. Het is een symptoom van een structurele spanning die de AI-industrie nog lang zal bezighouden. De behoefte aan grote, diverse trainingsdatasets en de bescherming van de grondrechten van Europese burgers botsen hier frontaal.

De AP heeft eerder al gewaarschuwd voor onrechtmatig gebruik van persoonsgegevens in AI-contexten. De zaak rondom LinkedIn en de AP-waarschuwing, en de waarschuwing over beveiligingsrisico's van AI-agents, laten zien dat de toezichthouder bereid is om handhavend op te treden, ook tegen grote techbedrijven met diepe zakken en goede advocaten.

Het kort geding maakt duidelijk: de AP laat zich niet afschepen met beroepen op het verschoningsrecht. De rechter gaf de AP gelijk. En als de AP uiteindelijk vaststelt dat Reddit de AVG heeft overtreden, is dat een precedent dat het verdienmodel van "we verkopen onze API-data aan AI-bedrijven" juridisch grondig ondermijnt.

Conclusie

De uitspraak van 4 maart is procedureel, maar de inzet is veel groter. De AP onderzoekt of het verkopen van gebruikersdata aan AI-trainers rechtmatig is onder de AVG. Artikel 53 van de AI Act legt bovendien transparantieverplichtingen op die de keten van verantwoordelijkheid verder aanscherpen.

Voor organisaties die externe data inzetten voor AI-toepassingen - of dat nu via scraping, API-deals of datapakketten is - is dit het moment om de herkomst en rechtmatigheid van die data serieus te nemen. "Publiek beschikbaar" is geen vrijbrief. De toezichthouder laat zien dat ze bereid is dat te handhaven, en de rechter heeft haar daarin gelijk gegeven.