Reddit heeft deze week een grote verandering doorgevoerd om te voorkomen dat de inhoud zonder toestemming wordt gebruikt. Ze hebben iets bijgewerkt dat het robots.txt-bestand wordt genoemd en dat computerprogramma’s (zoals die door zoekmachines worden gebruikt) vertelt of ze een website kunnen bekijken. Dit bestand is belangrijk om ervoor te zorgen dat zoekmachines u websites kunnen laten zien wanneer u naar iets zoekt.
Maar nu, met de opkomst van kunstmatige intelligentie, gebruiken sommige bedrijven inhoud van websites als Reddit om hun AI-systemen te trainen zonder de oorspronkelijke makers daarvoor te vragen of de eer te geven. Dit is een groot probleem geworden omdat er geen respect wordt getoond voor de mensen die de inhoud hebben gemaakt of voor de websites die deze hosten.
Wat doet Reddit?
Reddit’s update van het robots.txt-bestand is bedoeld om te controleren hoe de content wordt gebruikt. Ze gaan ook onbekende computerprogramma’s en bots beperken en blokkeren om toegang te krijgen tot hun site als ze zich niet houden aan de regels van Reddit of geen toestemming hebben om de content te gebruiken.
Reddit zegt dat deze veranderingen geen gevolgen zullen hebben voor de meeste mensen of goede organisaties zoals onderzoekers of groepen die de internetgeschiedenis bewaren (zoals het internetarchief). In plaats daarvan proberen ze AI-bedrijven ervan te weerhouden de inhoud van Reddit zonder toestemming te gebruiken. Deze AI-programma’s kunnen echter nog steeds de regels van Reddit negeren.
Recent onderzoek en reacties
De aankondiging volgt op een rapport van Wired, waaruit bleek dat een AI-aangedreven zoekbedrijf genaamd Perplexity inhoud van websites haalde, ook al was dat in het robots.txt-bestand niet toegestaan. De CEO van Perplexity betoogde dat deze regels geen wettelijke vereisten zijn, wat leidde tot een debat over hoe websites hun inhoud kunnen beschermen.
De Reddit-gegevens zijn voorlopig eigendom van Google
De nieuwe regels van Reddit hebben geen invloed op bedrijven die al overeenkomsten met hen hebben. Reddit heeft bijvoorbeeld een deal van $60 miljoen met Google, waardoor Google de gegevens van Reddit kan gebruiken voor zijn AI-projecten. Dit laat zien dat Reddit voorzichtig is met wie zijn gegevens kan gebruiken en ervoor wil zorgen dat dit betrouwbare partners zijn.
“Iedereen die de content van Reddit gebruikt, moet onze regels volgen om Reddit-gebruikers te beschermen”, aldus Reddit in een blogpost“We kiezen zorgvuldig met wie we samenwerken en vertrouwen hen toegang tot Reddit-content toe.”
Vooruit kijken
Deze wijziging door Reddit maakt deel uit van hun inspanningen om te controleren hoe hun gegevens worden gebruikt, vooral door bedrijven om commerciële redenen. Het toont een groeiende trend onder websites om hun inhoud te beschermen in het tijdperk van AI en big data.
De stap van Reddit geeft een duidelijke boodschap af: hoewel AI een groot potentieel heeft, is het respecteren van waar gegevens vandaan komen en het verkrijgen van toestemming erg belangrijk. Naarmate het internet verandert, kunnen de acties van Reddit van invloed zijn op de manier waarop andere websites hun inhoud en gebruikersrechten beschermen.
Alle afbeeldingen worden gegenereerd door Eray Eliaçık/Bing
Source: Reddit laat u betalen voor zijn gegevens