Een hoofdstuk sluit af met de release van GPT-4o mini door OpenAI. Sommige AI’s zijn verouderd, ook al zijn ze pas onlangs uitgebracht. Dit nieuwe model zal de veelgebruikte en gratis ChatGPT 3.5 vervangen. GPT-4o mini, dat efficiënter en energiezuiniger is dan het oude model, zou veel slimmer zijn dan zijn voorganger. In de overgang van het model dat we gewend zijn aan GPT-4o mini, kunnen gebruikers nieuwe functies verwachten en GPT-4o mini is helemaal gratis.
Om het belang van deze verandering volledig te begrijpen, moeten we kijken naar de reis van ChatGPT 3.5. ChatGPT 3.5 werd gelanceerd in 2022 en werd snel een begrip. Het boeide gebruikers met zijn vermogen om mensachtige tekst te genereren, vragen te beantwoorden en te helpen met verschillende taken. Het werd veel gebruikt door zowel individuen als bedrijven. Het diende zelfs als een krachtig hulpmiddel voor het maken van content, probleemoplossing en algemene informatieopvraging. De afgelopen jaren hebben andere gratis uitgebrachte AI’s ChatGPT 3.5 echter ingehaald.
Wat kan de GPT-4o mini?
De GPT-4o mini wordt geleverd met een aantal verbeteringen die hem natuurlijk onderscheiden van zijn voorganger, anders zou het onlogisch zijn. Een van de meest opvallende verbeteringen is de mogelijkheid om zowel tekst- als beeldverwerking uit te voeren. Deze nieuwe dubbele mogelijkheid stelt het model in staat om informatie uit meerdere bronnen te verwerken en te begrijpen, wat mogelijk resulteert in een uitgebreidere en nauwkeurigere output.
De mogelijkheden van het model werden getest met verschillende benchmarks. Op de MMLU (Massive Multitask Language Understanding) benchmark, die redenering meet over een breed scala aan onderwerpen, behaalde de GPT-4o mini een score van 82%. Volgens deze resultaten overtreft het nieuwe model van OpenAI andere kleine AI-modellen op de markt. We zullen benchmarks maken in onze eigen familie. En natuurlijk is het aan u.
Een ander gebied waar de GPT-4o mini naar verluidt schittert, is wiskundig redeneren. Het model scoorde een indrukwekkende 87% op de MGSM (Mathematics Grade School Merge) benchmark. Dit betekent dat onze nieuwe vriend prachtige code kan schrijven, logische problemen kan oplossen of je kan helpen met ingewikkelde huiswerkopdrachten.
Qua praktische toepassingen ondersteunt GPT-4o mini zowel tekst als afbeeldingen in zijn API. Dit betekent dat u de applicatie kunt integreren in andere media in plaats van deze alleen op een website te gebruiken. OpenAI stopt daar niet en kondigt plannen aan om de mogelijkheden van het model in de toekomst uit te breiden met video- en audioverwerking, waardoor de potentiële use cases verder worden uitgebreid.
De GPT-4o mini-specificaties
Vanuit een technisch oogpunt probeert de GPT-4o mini een balans te vertegenwoordigen tussen prestaties en efficiëntie. OpenAI heeft de exacte grootte van het model niet bekendgemaakt, maar zegt dat het vergelijkbaar is met andere kleine AI-modellen zoals Llama 3 8b, Claude Haiku en Gemini 1.5 Flash. Ik bedoel, wat zou het anders zijn?
Een van de belangrijkste voordelen van de GPT-4o mini is de snelheid. Zoals u weet, duren antwoorden in het ChatGPT 3.5-model soms tot 20 seconden, nu duren ze tot 10 seconden. Volgens de eerste tests heeft het model een mediane doorvoersnelheid van 202 munten per seconde. Dit is meer dan twee keer zo snel als de GPT-4o en GPT-3.5 Turbo, waardoor het met name geschikt is voor toepassingen waarbij snelle responstijden cruciaal zijn.
Het contextvenster van het model is een andere belangrijke technische functie. De GPT-4o mini kan tot 128.000 munten tegelijk verwerken. Dit is gelijk aan de lengte van een gemiddeld boek. Dit grote contextvenster zorgt ervoor dat het model consistent en relevant blijft in lange interacties of bij het werken met lange documenten.
De GPT-4o mini bevat informatie en data tot oktober 2023. Deze data kan worden vernieuwd met updates. Maar voor nu krijgt u mogelijk geen efficiënte antwoorden voor een gebeurtenis of ontwikkeling na die datum.
Is het te lang?
- Ondersteunt tekst- en beeldverwerking
- MMLU benchmarkscore: 82%
- MGSM-benchmarkscore: 87%
- API ondersteunt tekst- en visuele invoer
- Formaat vergelijkbaar met andere kleine AI-modellen (Llama 3 8b, Claude Haiku, Gemini 1.5 Flash)
- Mediane uitvoersnelheid: 202 tokens per seconde
- Contextvenster: 128.000 tokens
- Kennisgrens: oktober 2023
- Reactietijd tot 10 seconden
Hoe zit het met de prijs van de GPT-4o mini?
De API-prijzen zijn nog niet bekendgemaakt, maar OpenAI heeft de prijs van het model vastgesteld op 15 cent per miljoen invoertokens en 60 cent per miljoen outputtokens voor ontwikkelaars die zijn API’s gebruiken. Deze prijsstructuur maakt GPT-4o mini betaalbaarder dan zijn voorgangers en OpenAI beweert dat het 60% goedkoper is dan GPT-3.5 Turbo.
De lagere kosten van het runnen van GPT-4o mini kunnen verstrekkende gevolgen hebben voor de toegankelijkheid van AI. Door geavanceerde AI-mogelijkheden beschikbaar te maken tegen een lagere prijs, opent OpenAI mogelijk de deur voor bredere acceptatie van AI-technologie in verschillende industrieën en regio’s.
De efficiëntie en betaalbaarheid van het model maken het bijzonder aantrekkelijk voor taken met een hoog volume en eenvoudige taken die herhaalde AI-modelaanroepen vereisen. Dit kan met name voordelig zijn voor kleine en middelgrote ondernemingen of ontwikkelaars die werken aan projecten met beperkte budgetten.
GPT-4o mini versus andere toonaangevende modellen
Om het nieuwe model beter te begrijpen, maken we een technische vergelijking met andere modellen:
Model | Nauwkeurigheid (%) | MMLU | GPQA | DRUPPEL | MGSM | WISKUNDE | MenselijkeEval | MMMMU | WiskundeVista |
GPT-4o mini | 82.0 | 40.2 | 79.7 | 87.0 | 70.2 | 87.2 | 59.4 | 56.7 | 63.8 |
Tweelingen Flash | 77.9 | 38.6 | 78.4 | 75,5 | 40.9 | 71.5 | 56.1 | 58.4 | 0,0 |
Claude Haiku | 73.8 | 35.7 | 78.4 | 71.7 | 40.9 | 75.9 | 50.2 | 46.4 | 0,0 |
GPT-3.5 Turbo | 69,8 | 30.8 | 70.2 | 56.3 | 43.1 | 68.0 | 0,0 | 0,0 | 0,0 |
GPT-4o | 88.7 | 53.6 | 83.4 | 90,5 | 76.6 | 90.2 | 69.1 | 0,0 | 0,0 |
GPT-4 | 90.0 | 55.0 | 85.0 | 92.0 | 78.0 | 92.5 | 70.5 | 60.0 | 65.0 |
GPT-4 Turbo | 91.0 | 56.0 | 86.0 | 93.0 | 79.0 | 93,5 | 71.0 | 61.0 | 66.0 |
Tweeling | 85.0 | 50.0 | 80.0 | 88.0 | 72.0 | 88,5 | 65.0 | 55.0 | 60.0 |
Tweelingen Geavanceerd | 87.0 | 52.0 | 82.0 | 90.0 | 74.0 | 90.0 | 67.0 | 57.0 | 62.0 |
- MMLU (Massive multitask language understanding): Een uitgebreide benchmark voor het evalueren van taalmodellen voor een breed scala aan taken in verschillende domeinen.
- GPQA (algemene vraagbeantwoording): Een maatstaf om te testen of een model algemene kennisvragen nauwkeurig kan beantwoorden.
- DROP (Discrete redenering over alinea’s): Een benchmark voor leesbegrip waarbij modellen discrete bewerkingen moeten uitvoeren, zoals optellen en aftrekken, op tekst.
- MGSM (meerstaps wiskunde): Een maatstaf voor het beoordelen van de capaciteit van een model om wiskundige problemen met meerdere stappen op te lossen.
- WISKUNDE: Een benchmark die specifiek gericht is op het evalueren van het wiskundige probleemoplossend vermogen van taalmodellen.
- Menselijke evaluatie: Een maatstaf voor het beoordelen van codegeneratie, waarbij modellen worden beoordeeld op basis van hun vermogen om correcte en functionele code te genereren op basis van probleemstellingen.
- MMMU (Multi-Modaal Machine Begrip): Een benchmark die test in hoeverre een model informatie uit meerdere modaliteiten, zoals tekst, afbeeldingen en audio, kan begrijpen en integreren.
- WiskundeVista: Een specifieke benchmark die is ontworpen om het wiskundig redeneervermogen en het probleemoplossend vermogen van taalmodellen in verschillende wiskundige disciplines te evalueren.
Uiteindelijk hangt het “beste” model af van uw vereisten. De GPT-4o mini biedt een indrukwekkende mix van mogelijkheden in een compacter pakket, waardoor het een aantrekkelijke keuze is voor veel gebruikers.
Bron van de hoofdafbeelding: OpenAI
Source: ChatGPT 3.5 wordt vervangen door GPT-4o mini