Auteurs beschuldigden NVIDIA van inbreuk op het auteursrecht in een uitgebreide class action-rechtszaak die onlangs werd aangespannen, waarin werd beweerd dat het bedrijf miljoenen illegale boeken uit Anna’s Archive had verkregen voor AI-training. De klacht citeert interne documenten waaruit blijkt dat NVIDIA snelle toegang zocht tot de gegevens van de schaduwbibliotheek.
NVIDIA, een chipfabrikant, heeft hogere inkomsten uit de kunstmatige-intelligentiesector gezien als gevolg van de vraag naar zijn AI-leerchips en datacenterdiensten. Het bedrijf ontwikkelt AI-modellen zoals NeMo, Retro-48B, InstructRetro en Megatron, getraind met behulp van zijn hardware en uitgebreide tekstbibliotheken.
Deze juridische uitdaging volgt op eerdere rechtszaken waarin auteurs technologiebedrijven beschuldigden van het trainen van AI-modellen op basis van illegale boeken. Begin 2024 klaagden auteurs NVIDIA aan, omdat ze beweerden dat de AI-modellen zonder toestemming waren getraind op de Books3-dataset, die auteursrechtelijk beschermde werken van de Bibliotik-site bevatte. NVIDIA verdedigde haar acties als redelijk gebruik en stelde dat boeken functioneerden als statistische correlaties voor haar AI-modellen. Tijdens de ontdekking ontdekten de eisers aanvullend bewijsmateriaal.
Vrijdag dienden auteurs een gewijzigde klacht in die de rechtszaak verruimde. Deze update bevatte meer boeken, auteurs en AI-modellen, naast nieuwe claims over de ‘schaduwbibliotheek’. Auteurs, waaronder Abdi Nazemian, citeerden interne e-mails en documenten van NVIDIA en beweerden dat het bedrijf bereidwillig miljoenen auteursrechtelijk beschermde boeken had gedownload. De klacht beweert dat “concurrentiedruk NVIDIA tot piraterij heeft aangezet”, waarbij sprake is van samenwerking met Anna’s Archive.
Volgens de gewijzigde klacht heeft een lid van het datastrategieteam van NVIDIA contact opgenomen met Anna’s Archive om het dataaanbod te beoordelen. De klacht beschrijft de interactie: “Wanhopig op zoek naar boeken nam NVIDIA contact op met Anna’s Archive – de grootste en meest brutale van de resterende schaduwbibliotheken – over het verwerven van miljoenen illegaal materiaal en ‘het opnemen van Anna’s Archive in pre-trainingsgegevens voor onze LLM’s’.” Anna’s Archive rekende tienduizenden dollars aan voor “snelle toegang” tot zijn illegale collecties; NVIDIA heeft de details van deze toegang onderzocht.
In de klacht staat dat Anna’s Archive NVIDIA op de hoogte heeft gesteld van het illegale karakter van zijn bibliotheek. De piratenbibliotheek vroeg vervolgens leidinggevenden van NVIDIA of er intern toestemming was verleend om door te gaan. De toestemming zou binnen een week zijn verleend, waarna Anna’s Archief toegang verleende tot zijn illegale boeken. “Binnen een week nadat ze contact hadden opgenomen met Anna’s Archive, en dagen nadat ze door Anna’s Archive waren gewaarschuwd voor het illegale karakter van hun collecties, gaf het management van NVIDIA ‘groen licht’ om door te gaan met de piraterij. Anna’s Archive bood NVIDIA miljoenen illegale, auteursrechtelijk beschermde boeken aan”, aldus de klacht.
Anna’s Archive beloofde NVIDIA toegang tot ongeveer 500 terabytes aan gegevens, met daarin miljoenen boeken die doorgaans beschikbaar zijn via het digitale uitleensysteem van het Internet Archive, dat zelf juridisch onder de loep is genomen. In de klacht wordt niet gespecificeerd of NVIDIA Anna’s Archive voor deze toegang heeft betaald. Naast de Books3-database beweert de klacht dat NVIDIA boeken heeft gedownload van LibGen, Sci-Hub en Z-Library.
Auteurs beweren ook dat NVIDIA scripts en tools heeft gedistribueerd waarmee zakelijke klanten automatisch “The Pile” kunnen downloaden, die de illegale Books3-dataset bevat. Deze claims introduceren beschuldigingen van plaatsvervangende en bijdragende inbreuk, waarbij wordt beweerd dat NVIDIA inkomsten genereerde van klanten door de toegang tot deze datasets te vergemakkelijken. De auteurs eisen schadevergoeding voor de genoemde auteurs en mogelijk honderden anderen in de class action-rechtszaak. Dit is de eerste openbare openbaarmaking van correspondentie tussen een groot Amerikaans technologiebedrijf en Anna’s Archive, waardoor de zichtbaarheid van de piratenbibliotheek mogelijk wordt vergroot na het recente verlies van domeinnamen.
Een kopie van de eerste geconsolideerde en gewijzigde klacht, ingediend bij de Amerikaanse districtsrechtbank voor het noordelijke district van Californië, is beschikbaar in pdf-formaat. Genoemde auteurs zijn onder meer Abdi Nazemian, Brian Keene, Stewart O’Nan, Andre Dubus III en Susan Orlean.








