Anthropic heeft zijn nieuwste AI-model uitgebracht, Claude Opus 4.7, gekenmerkt als een “opmerkelijke verbetering” ten opzichte van Opus 4.6, maar toch “minder breed capabel” dan de nog niet uitgebrachte Opus Mythos Preview. Het nieuwe model versterkt de bestaande sterke punten en richt zich op coderen, engineering en taken die uit meerdere stappen bestaan.

Claude Opus 4.7 laat superieure prestaties zien op het gebied van professioneel kenniswerk en beweert “grondiger en consistenter” te zijn in uitdagende contexten. De benchmarkingtests van het model demonstreren de mogelijkheden ervan, met een score van 64,3% in agentische codering op SWE-bench Pro en SWE-bench Verified, waarmee de toppositie onder de publiek beschikbare modellen opnieuw wordt opgeëist.

In vergelijking met Opus 4.6 vertoont Opus 4.7 ook verbeteringen in het computergebruik en het redeneren op universitair niveau. Het laat echter een lichte daling zien in de kwetsbaarheidsscores voor cyberbeveiliging, namelijk 73,1% vergeleken met 73,8% voor de vorige versie. Anthropic merkte op dat deze verandering het gevolg kan zijn van nieuwe veiligheidsmaatregelen die bedoeld zijn om cyberbeveiligingsverzoeken met een hoog risico op te sporen en te blokkeren.

De lancering van Claude Opus 4.7 lijkt de Claude Mythos Preview te promoten, die superieure prestaties heeft laten zien in de belangrijkste benchmarks, maar momenteel alleen beschikbaar is voor geselecteerde organisaties. Anthropic benadrukte dat de cybermogelijkheden van Opus 4.7 niet overeenkomen met die van Mythos Preview.

  Anthropic's Project Glasswing signaleert 10.000 kritieke softwarefouten

“We hebben verklaard dat we de release van Claude Mythos Preview beperkt zouden houden en eerst nieuwe cyberbeveiligingen zouden testen op minder capabele modellen”, aldus het bedrijf. “Opus 4.7 is het eerste model van dien aard: de cybermogelijkheden zijn niet zo geavanceerd als die van Mythos Preview.”

Claude Opus 4.7 is onmiddellijk beschikbaar voor alle Claude-producten en via de API van het bedrijf, waarbij dezelfde prijzen gelden als eerdere modellen.


Aanbevolen afbeeldingscredits