Google lanceert Gemini 3.1 Flash-Lite als snelste, goedkope Gemini-model

Google lanceerde Gemini 3.1 Flash-Lite, het snelste en meest betaalbare Gemini 3-model tot nu toe, met een prijs van $0,25 per miljoen inputtokens en $1,50 per miljoen outputtokens.

Het model is gericht op grote werklasten voor ontwikkelaars, gegevensverwerking en vertaaltaken. Het is als preview beschikbaar via de Gemini API in Google AI Studio en Vertex AI, maar is niet opgenomen in de Gemini consumentenapp.

Vergeleken met Gemini 2.5 Flash-Lite is de nieuwe versie duurder maar aanzienlijk capabeler. Het presteert over het algemeen beter dan Gemini 2.5 Flash tegen een lagere prijs.

Het model presteert beter dan concurrenten, waaronder de GPT-5 mini en Claude 4.5 Haiku. Grok 4.1 Fast is betaalbaarder, maar Gemini 3.1 Flash-Lite is sneller en belooft tot 363 tokens per seconde.

PUBG x NieR: Automata-skins zijn uit

Op multimodale benchmarks scoorde het model 1432 Elo-punten op het Arena.ai Leaderboard. Dit plaatst hem tussen open-weight-modellen en commerciële aanbiedingen van de laatste generatie.

Google heeft geen agentbenchmarks gepubliceerd voor de release. Het bedrijf verklaarde dat het model bedoeld is voor taken met een groot volume en gegevensverwerking, en niet voor het beheer van een vloot agenten.

Ontwikkelaars kunnen de API gebruiken om de redeneertijd van het model voor kostenbeheersing af te stemmen. Lagere redeneringsinstellingen produceren minder tokens, wat relevant is voor werklasten met een hoog volume.

Dit is de eerste Flash-Lite-versie voor Gemini 3.1. Google lanceert traditioneel eerst krachtigere Flash-versies of slaat Flash-Lite volledig over, zoals bij Gemini 3.

Google lanceerde Gemini 3.1 Pro twee weken eerder. Het bedrijf beschrijft Flash-Lite als bedoeld voor grootschalige ontwikkelaarsworkloads.

Aanbevolen afbeeldingscredits

Google lanceert Gemini 3.1 Flash-Lite als snelste, goedkope Gemini-model

Related Stories

Apple brengt meer persoonlijke Siri-spraakbediening naar bèta 3

Uit antropisch onderzoek blijkt dat Claude-modellen een interne werkruimte vormen die lijkt op bewustzijn

Apple activeert Siri AI op Apple Watch in watchOS 27 bèta 3

Het gerucht gaat dat Apple in 2026 de opvouwbare iPhone Ultra zal lanceren