Anthropic heeft maandag de lancering aangekondigd van Claude Sonnet 4.5, een nieuw grensmodel dat volgens het bedrijf state-of-the-art prestaties levert op het gebied van codeerbenchmarks. Het bedrijf verklaarde dat het model ‘productieklare’ applicaties kan bouwen, wat een verbetering van de betrouwbaarheid betekent ten opzichte van eerdere AI-modellen. Claude Sonnet 4.5 is toegankelijk via de Claude API en de Claude-chatbot, waarbij de prijzen voor ontwikkelaars hetzelfde blijven als voor Claude Sonnet 4: $3 per miljoen inputtokens en $15 per miljoen outputtokens.
De AI-modellen van Anthropic worden gebruikt door ontwikkelaars en bedrijven, en volgens berichten gebruiken Apple en Meta ze intern. Het bedrijf verkoopt ook API-toegang tot AI-coderingsapplicaties zoals Cursor, Windsurf en Replit. Deze release volgt op recente rapporten dat OpenAI’s GPT-5 de modellen van Anthropic heeft uitgedaagd door ze beter te presteren op verschillende codeerbenchmarks.
Volgens Anthropic behaalt Claude Sonnet 4.5 toonaangevende prestaties op benchmarks zoals SWE-Bench Verified. Antropische AI-onderzoeker David Hershey stelde dat benchmarkresultaten alleen niet de volledige mogelijkheden van het model weergeven. Hershey rapporteerde dat hij de modelcode tot 30 uur autonoom observeerde tijdens vroege tests met zakelijke klanten. In deze sessies bouwde de AI een applicatie, zette databaseservices op, kocht domeinnamen aan en voerde een SOC 2-audit uit. Michael Truell, CEO van Cursor, beschreef Claude Sonnet 4.5 als “state-of-the-art codeerprestaties, vooral bij taken met een langere horizon.” Jeff Wang, CEO van Windsurf, noemde het model een ‘nieuwe generatie codeermodellen’.
Anthropic beweert ook dat Claude Sonnet 4.5 het meest op elkaar afgestemde AI-model tot nu toe is, met minder sycofantie en bedrog dan zijn voorgangers. Het bedrijf zei dat het de weerstand van het model tegen snelle injectie-aanvallen heeft verbeterd.








