Volgens wekelijkse gegevens die op 24 februari 2026 zijn gepubliceerd, zijn in China gebouwde grote taalmodellen nu verantwoordelijk voor 61% van het totale tokenverbruik op OpenRouter, ‘s werelds grootste LLM API-aggregatieplatform. De drie meest gebruikte modellen op het platform zijn allemaal ontwikkeld door Chinese AI-laboratoria.
MiniMax M2.5 claimde de eerste plaats met 2,45 biljoen tokens die in één week werden verbruikt, een stijging van 197% ten opzichte van de week ervoor. Kimi K2.5 van Moonshot AI volgde met 1,21 biljoen tokens, hoewel het gebruik ervan week na week met 20% daalde. Zhipu AI’s GLM-5 werd derde met 780 miljard tokens na een stijging van 158%. DeepSeek V3.2 staat op de vijfde plaats van alle modellen op het platform. Samen waren Chinese modellen goed voor 5,3 biljoen van de 8,7 biljoen tokens die door de top 10 modellen van het platform werden gebruikt.
De stijging in het gebruik van de MiniMax M2.5 werd gedeeltelijk veroorzaakt door gratis promotionele toegang. Kilo Code, een door AI aangedreven codeertool, bood het model vanaf 12 februari een week lang kosteloos aan. Cline, een andere ontwikkelaarstool, voerde een soortgelijke promotie.
MiniMax M2.5 scoort 80,2% op SWE-Bench Verified, waarmee hij binnen een punt van Anthropic’s Claude Opus 4.6 komt met 80,8%.
Programmeren is de grootste categorie van tokenconsumptie op OpenRouter geworden en groeit van 11% naar ruim 50% van het totale aantal tokens in 2025. Agentgestuurde workflows, waarin modellen autonoom taken in meerdere stappen uitvoeren, zijn nu verantwoordelijk voor meer dan de helft van alle uitvoertokens op het platform.
OpenRouter COO Chris Clark verklaarde dat Chinese open-weight-modellen onevenredig zwaar zijn in de agentische stromen van Amerikaanse bedrijven. Alle drie de best gerangschikte Chinese modellen van deze week zijn geoptimaliseerd voor codering en agentautomatisering.
De kosten blijven een bepalende factor. MiniMax M2.5 brengt $0,30 per miljoen inputtokens en $1,10 per miljoen outputtokens in rekening. GLM-5 kost $0,30 per miljoen inputtokens en $2,55 per miljoen outputtokens. Ter vergelijking: Claude Opus 4.6 kost $5 per miljoen inputtokens en $25 per miljoen outputtokens, ongeveer 10 tot 20 keer duurder.
Het totale wekelijkse tokenverbruik van OpenRouter heeft ongeveer 12,1 biljoen bereikt, een 12,7-voudige stijging ten opzichte van een jaar geleden. Het platform, opgericht door voormalig OpenSea CTO Alex Atallah, biedt een uniforme API-gateway voor meer dan 400 modellen van meer dan 60 providers.
Andreessen Horowitz-partner Martin Casado schatte dat ongeveer 80% van de startups die open-source AI-stacks gebruiken, Chinese modellen gebruiken. MIT Technology Review meldde dat de acceptatie van Chinese open-weight-modellen in Silicon Valley versnelt.








