Z.ai, voorheen bekend als Zhipu AI, heeft dinsdag het GLM-5.1-model uitgebracht. Dit open-source vlaggenschipmodel is ontworpen voor agentic engineering en kan een enkele codeertaak autonoom gedurende maximaal acht uur uitvoeren, waarbij planning, uitvoering, testen en optimalisatie in een continue lus worden uitgevoerd.
Het GLM-5.1-model scoorde 58,4 op de SWE-Bench Pro-benchmark en presteerde daarmee beter dan GPT-5.4, Claude Opus 4.6 en Gemini 3.1 Pro. Deze release volgt op een verfijning na de training van GLM-5, dat in februari werd geïntroduceerd als een Mixture-of-Experts-model met 744 miljard parameters, waarbij gebruik wordt gemaakt van ongeveer 40 miljard actieve parameters per token en volledig is getraind op Huawei Ascend-chips zonder Nvidia-hardware.
Volgens de documentatie van Z.ai verbetert GLM-5.1 de codeer- en agentische mogelijkheden door middel van technieken zoals fijnafstemming onder toezicht van meerdere taken en leerfasen voor versterking. Het model kan een autonome uitvoering van acht uur volhouden, waarbij een volledige “experimenteren-analyseren-optimaliseren”-lus wordt voltooid. In demonstraties werd binnen acht uur met succes een compleet Linux-desktopsysteem vanaf nul opgebouwd, waarbij 655 iteraties werden uitgevoerd en de doorvoer van vectordatabasequery’s met 6,9 keer werd verhoogd.
GLM-5.1 beschikt over een contextvenster van 200.000 tokens en ondersteunt maximaal 128.000 uitvoertokens. Het is geoptimaliseerd voor workflows voor agentische codering en is compatibel met tools zoals Claude Code en OpenClaw. Het model behaalde een geometrisch gemiddelde versnelling van 3,6x op echte machine learning-workloads in de KernelBench Level 3-optimalisatiebenchmark.
GLM-5.1 is beschikbaar voor alle abonnees van het GLM Coding Plan, waarbij de gewichten worden gepubliceerd onder een MIT-licentie. Z.ai, dat in januari naar de beurs ging op de Hong Kong Stock Exchange met een waardering van $31,3 miljard, biedt API-toegang voor GLM-5.1 aan voor $1,00 per miljoen inputtokens en $3,20 per miljoen outputtokens.
De lancering doet de concurrentie op het gebied van open-source coderingsmodellen escaleren, waardoor GLM-5.1 op de SWE-Bench Pro voorop loopt, vóór zijn closed-source tegenhangers. Hoewel Z.ai beweert dat de mogelijkheden van het model overeenkomen met Claude Opus 4.6, blijkt uit onafhankelijke evaluaties dat het ongeveer 94,6 procent van de bredere codeerscore van Opus 4.6 behaalt, wat wijst op enkele hiaten in redeneer- en creatieve taken.








