OpenAI zegt dat de gratis ChatGPT-gezondheidsfouten met 71 procent zijn gedaald

OpenAI heeft GPT-5.5 Instant gelanceerd als het standaardmodel voor gratis ChatGPT-gebruikers en beweert dat het nu overeenkomt met de prestaties van zijn grensverleggende Thinking-modellen op het gebied van gezondheidsvragen op basis van interne evaluaties. Gezondheidsinformatie is onder verscherpt toezicht komen te staan, vooral nadat een Guardian-onderzoek onnauwkeurigheden in de AI-overzichten van Google aanhaalde, wat Google ertoe aanzette deze functies in te trekken vanwege bepaalde gezondheidsgerelateerde vragen.

OpenAI verklaarde dat zijn updates een verbetering van de nauwkeurigheid van gezondheidsinformatie vertegenwoordigen. Door deze verschuiving heeft een groot publiek toegang tot medische reacties van ChatGPT zonder te worden doorverwezen naar externe bronnen, wat gevolgen zou kunnen hebben voor uitgevers en SEO’s in de gezondheidszorg.

Het bedrijf benadrukte de vooruitgang in zijn HealthBench- en HealthBench Professional-benchmarks en merkte op dat GPT-5.5 Instant beter presteert dan zijn voorganger, GPT-5.3 Instant. OpenAI rapporteerde ook een afname van 71% in de gezondheidsreacties die werden gemarkeerd vanwege potentiële feitelijkheidsproblemen gedurende twee maanden, verwijzend naar hun live verkeersmonitoringssystemen.

Bij een afzonderlijke beoordeling werden de door GPT-5.5 Instant gegenereerde antwoorden vergeleken met de antwoorden die door artsen waren geschreven in 3.500 representatieve gezondheidsgesprekken. In evaluaties beoordeelde een panel van artsen de antwoorden van het AI-model hoger dan die van menselijke artsen in termen van nauwkeurigheid, communicatie en volledigheid.

Google upgradet Zoeken met Gemini 3.5 Flash op I/O 2026

OpenAI beweerde dat GPT-5.5 Instant minder faalmodi vertoont dan oudere versies en menselijke reacties, wat wijst op minder gemiste waarschuwingssignalen en een kleinere kans dat gebruikers geen aanvullende context zoeken. HealthBench is ontwikkeld met behulp van input van het artsennetwerk van het bedrijf en maakt voor beoordeling gebruik van rubrieken die door artsen zijn gemaakt.

OpenAI werkt samen met meer dan 260 artsen in 60 landen, die gezamenlijk meer dan 700.000 voorbeeldreacties hebben beoordeeld. Hoewel dit cijfer consequent wordt aangehaald sinds de lancering van ChatGPT Health in januari, zijn er geen onafhankelijke beoordelingsresultaten vrijgegeven.

Volgens OpenAI vertegenwoordigen vragen over gezondheid en welzijn een aanzienlijk deel van de ChatGPT-interacties, waarbij wekelijks meer dan 230 miljoen gebruikers gezondheidsgerelateerde vragen stellen. Bovendien vallen gezondheidsdiscussies onder een strikt beleid dat advertenties verbiedt tijdens gesprekken over gezondheid, geestelijke gezondheid of politiek.

Anthropic lanceert gezondheidsfuncties voor Claude

De marktvraag naar gezondheidsinformatie via het gratis niveau van ChatGPT kan de nulklikdruk op uitgevers vergroten, omdat door AI gegenereerde reacties een verhoogde betrokkenheid zien, naar verluidt de hoogste van de categorieën die zijn geanalyseerd in de AI-overzichten van Google. De beweringen van OpenAI over de nauwkeurigheid van gezondheidsreacties ontberen momenteel validatie door derden, wat aanleiding geeft tot bezorgdheid over de betrouwbaarheid van de evaluaties.

De aankondiging maakte niet duidelijk hoe deze updates de citatieprotocollen zouden kunnen beïnvloeden, wat suggereert dat de verantwoordelijkheid voor het verifiëren van antwoorden en het aanpakken van verkeersverliezen zou kunnen verschuiven naar zorgverleners.

Aanbevolen afbeeldingscredits

OpenAI zegt dat de gratis ChatGPT-gezondheidsfouten met 71 procent zijn gedaald

Related Stories

Apple brengt meer persoonlijke Siri-spraakbediening naar bèta 3

Uit antropisch onderzoek blijkt dat Claude-modellen een interne werkruimte vormen die lijkt op bewustzijn

Apple activeert Siri AI op Apple Watch in watchOS 27 bèta 3

Midjourney dwingt Disney en anderen om intern AI-gebruik in een rechtszaak bekend te maken