Moderne AI-systemen maken gestructureerde oordelen over mensen die lijken op menselijk vertrouwen, maar aanzienlijk verschillen in methodologie, volgens een nieuwe studie van de Hebreeuwse Universiteit. Het onderzoek, gepubliceerd in de *Proceedings of the Royal Society*, analyseerde ruim 43.000 gesimuleerde beslissingen en ongeveer 1.000 menselijke deelnemers in vijf scenario’s.
Deze scenario’s omvatten het evalueren van kredietbeslissingen, het beoordelen van het vertrouwen in een babysitter, het beoordelen van de prestaties van een baas en het bepalen van donaties aan oprichters van non-profitorganisaties. Zowel mensen als AI vertoonden een voorkeur voor individuen die als competent, eerlijk en goedbedoeld werden beschouwd.
Prof. Yaniv Dover verklaarde: “AI neemt geen willekeurige beslissingen. Het legt iets reëel vast over hoe mensen elkaar evalueren.” Mensen vormen echter holistische indrukken door meerdere eigenschappen te integreren, terwijl AI afzonderlijke kenmerken zoals competentie en integriteit beoordeelt.
Valeria Lerman legde uit: “AI is schoner en systematischer, en dat kan tot heel verschillende resultaten leiden.” Deze structurele benadering was duidelijk, zelfs met een identieke context over individuen die werden beoordeeld.
Uit het onderzoek blijkt dat AI-vooroordelen systematischer, voorspelbaarder en soms sterker kunnen zijn dan menselijke vooroordelen. In financiële contexten vertoonden AI-systemen aanzienlijke verschillen op basis van demografische kenmerken. Oudere individuen kregen vaak de voorkeur bij beslissingen over leningen en donaties, terwijl religie en geslacht ook de uitkomsten in bepaalde AI-modellen beïnvloedden.
Met name kunnen verschillende AI-modellen verschillende beoordelingen van hetzelfde individu opleveren, wat erop wijst dat de keuze voor een AI-systeem een aanzienlijke impact kan hebben op de resultaten in de echte wereld. “Welk model je gebruikt, doet er echt toe”, merkte Lerman op.
Grote taalmodellen worden steeds vaker gebruikt voor het screenen van sollicitanten, het beoordelen van de kredietwaardigheid en het begeleiden van organisatorische beslissingen. Hoewel AI aspecten van het menselijk redeneren kan weerspiegelen, mist het het genuanceerde begrip dat uniek is voor de mens.
“Deze systemen zijn krachtig”, merkte Dover op. “Ze kunnen aspecten van het menselijk redeneren op een consistente manier modelleren. Maar ze zijn niet menselijk, en we moeten niet aannemen dat ze mensen zien zoals wij dat doen.”
De onderzoekers benadrukken dat het onderzoek de noodzaak benadrukt van het begrijpen van de oordelen van AI nu deze systemen overgaan van instrumenten naar autonome besluitvormers. Ze roepen op tot bewustzijn in plaats van voorzichtigheid, waarbij de nadruk ligt op de noodzaak om te begrijpen hoe AI vertrouwen waarneemt.








