OpenAI heeft per ongeluk cruciale gegevens verwijderd met betrekking tot de auteursrechtzaak met The New York Times tijdens lopende juridische procedures over claims wegens inbreuk op het auteursrecht. Bij het incident waren gegevens betrokken van speciale virtuele machines die aan de eisers werden verstrekt, wat OpenAI in een recente indiening bij de rechtbank heeft erkend. Als gevolg hiervan hebben advocaten van de Times verklaard dat ze een week aan werk in verband met de zaak hebben verloren.
OpenAI wordt geconfronteerd met tegenslag op het gebied van gegevensverlies in een rechtszaak met The New York Times
Volgens een brief van de Times‘ juridisch team, kostte dit gegevensverlies ‘een hele week aan het werk van zijn experts en advocaten’ en was het ‘onherstelbaar verloren’. De eisers onderzochten beweringen dat de modellen van OpenAI waren getraind op ongeautoriseerde inhoud. Als onderdeel van dit proces verzamelden ze gegevens tijdens 150 uur intensief onderzoek naar de trainingsdatasets van OpenAI, waarbij ze specifiek op zoek gingen naar gevallen van inbreuk op het auteursrecht. Een rapport van TechCrunch gaf aan dat de verwijdering plaatsvond op 14 november, toen “programma’s en zoekresultaten die waren opgeslagen op een van de speciale virtuele machines werden gewist door OpenAI-ingenieurs.”
De kern van de rechtszaak beweert dat OpenAI, samen met Microsoft – zijn partner die de technologie van OpenAI gebruikt voor zijn Bing AI-chatbot – inbreuk heeft gemaakt op het auteursrecht van The New York Times door zonder toestemming gebruik te maken van inhoud achter een betaalmuur. The Times beweert dat de modellen van OpenAI “bijna woordelijke” replica’s van de artikelen produceerden, wat het argument voor schadevergoeding vormde. OpenAI heeft deze beschuldigingen consequent weerlegd en beweerd dat de training gebaseerd was op openbaar beschikbare gegevens, wat volgens de auteursrechtwetten als redelijk gebruik kwalificeert.
Een woordvoerder van OpenAI merkte op dat het incident een “glitch” was. Tegelijkertijd hebben ze met succes de meeste verwijderde gegevens hersteld, en cruciale elementen, waaronder “de mapstructuur en bestandsnamen”, blijven verloren en bijgevolg onbruikbaar. Als gevolg hiervan staan de advocaten van de Times nu voor de uitdaging om hun bewijsverzameling vanaf de grond opnieuw op te starten. Ondanks de omstandigheden meldden ze dat ze ‘geen reden hadden om te geloven’ [the erasure] was opzettelijk”, waarbij wordt benadrukt dat OpenAI het best gepositioneerd is om zijn datasets te doorzoeken. Toch merkten ze ook de terughoudendheid van het bedrijf op om details over zijn trainingsgegevens vrij te geven.

Wat de zaken nog ingewikkelder maakt, zijn soortgelijke auteursrechtclaims tegen OpenAI. Een recente rechtszaak tegen het bedrijf door Raw Story en AlterNet werd afgewezen omdat de eisers niet voldoende bewijs konden leveren van de schade die verband hield met hun beschuldigingen. Daarentegen De New York Times heeft naar verluidt meer dan $ 1 miljoen aan juridische kosten geïnvesteerd om zijn zaak tegen OpenAI voort te zetten. Deze financiële toezegging illustreert de specifieke uitdaging van kleinere uitgevers in hun strijd tegen substantiële technologiebedrijven.
OpenAI daarentegen heeft onlangs licentieovereenkomsten gesloten met verschillende grote mediabedrijven, waardoor het gebruik van hun inhoud mogelijk is om zijn AI-modellen te trainen, waardoor compensatie en krediet wordt geboden. Uit rapporten blijkt dat OpenAI uitgeversgigant Dotdash Meredith minstens 16 miljoen dollar per jaar betaalt voor licentierechten, wat de strategie weerspiegelt van het zoeken naar formele partnerschappen in plaats van voortdurende rechtszaken.
Afbeelding tegoed: Furkan Demirkaya/Ideogram
Het bericht Het juridische probleem van de NewYork Times wordt groter naarmate OpenAI per ongeluk belangrijke gegevens verwijdert verscheen voor het eerst op TechBriefly.





