Google lanceerde Gemini 3.1 Flash-Lite, het snelste en meest betaalbare Gemini 3-model tot nu toe, met een prijs van $0,25 per miljoen inputtokens en $1,50 per miljoen outputtokens.

Het model is gericht op grote werklasten voor ontwikkelaars, gegevensverwerking en vertaaltaken. Het is als preview beschikbaar via de Gemini API in Google AI Studio en Vertex AI, maar is niet opgenomen in de Gemini consumentenapp.

Vergeleken met Gemini 2.5 Flash-Lite is de nieuwe versie duurder maar aanzienlijk capabeler. Het presteert over het algemeen beter dan Gemini 2.5 Flash tegen een lagere prijs.

Het model presteert beter dan concurrenten, waaronder de GPT-5 mini en Claude 4.5 Haiku. Grok 4.1 Fast is betaalbaarder, maar Gemini 3.1 Flash-Lite is sneller en belooft tot 363 tokens per seconde.

  Hoe likes op je Facebook-berichten te verbergen?

Op multimodale benchmarks scoorde het model 1432 Elo-punten op het Arena.ai Leaderboard. Dit plaatst hem tussen open-weight-modellen en commerciële aanbiedingen van de laatste generatie.

Google heeft geen agentbenchmarks gepubliceerd voor de release. Het bedrijf verklaarde dat het model bedoeld is voor taken met een groot volume en gegevensverwerking, en niet voor het beheer van een vloot agenten.

Ontwikkelaars kunnen de API gebruiken om de redeneertijd van het model voor kostenbeheersing af te stemmen. Lagere redeneringsinstellingen produceren minder tokens, wat relevant is voor werklasten met een hoog volume.

Dit is de eerste Flash-Lite-versie voor Gemini 3.1. Google lanceert traditioneel eerst krachtigere Flash-versies of slaat Flash-Lite volledig over, zoals bij Gemini 3.

Google lanceerde Gemini 3.1 Pro twee weken eerder. Het bedrijf beschrijft Flash-Lite als bedoeld voor grootschalige ontwikkelaarsworkloads.


Aanbevolen afbeeldingscredits