Meta AI’s Llama 3.1 405b is een hit die indruk heeft weten te maken op veel gebruikers. Het nieuwe model is geen kleintje – het is een grote vis in een steeds groter wordende pool van taalmodellen. Laten we eens kijken naar de AI die iedereen aan het praten en schrijven krijgt.
Meta AI’s Llama 3.1 405b is, zoals de naam al doet vermoeden, een groot taalmodel met 405 miljard parameters. Het maakt deel uit van Meta’s Llama 3-serie, gelanceerd in april 2024. Vroege benchmarks suggereren dat dit model de huidige leiders in verschillende belangrijke AI-tests zou kunnen overtreffen.
Een paard van een andere kleur: Meta AI’s Llama 3.1 405b-specificaties
Meta AI, voorheen bekend als Facebook AI Research, is de afdeling kunstmatige intelligentieonderzoek van Meta Platforms. Ze introduceerden Llama (Large Language Model Meta AI) in 2023 als een open-sourcealternatief voor propriëtaire taalmodellen. Llama werd snel populair in de AI-community. Voortbouwend op dit succes bracht Meta in 2023 Llama 2 uit, dat aanzienlijke verbeteringen liet zien.
Nu, met Llama 3, heeft Meta de grenzen nog verder verlegd, met als hoogtepunt het krachtige Llama 3.1 405b-model dat we vandaag bespreken. Deze snelle progressie toont Meta’s toewijding aan het bevorderen van open-source AI-technologie.
In dit tijdperk waarin kunstmatige intelligentie overal om ons heen is, stoppen bedrijven niet. In een tijdperk waarin we naar oude game graphics kijken en ons afvragen hoeveel er nog verbeterd kan worden, zijn we nieuwe graphics gaan vergeven, en hetzelfde geldt voor kunstmatige intelligentie.
Meta AI is geen slappeling als het aankomt op prestaties. Dit model heeft 405 miljard parameters, wat het een zwaargewicht maakt in de AI-arena. Wat betekent deze 405b-parameter?
Neigh-ver zegt nooit: Meta AI’s Llama 3.1 405b versus concurrenten
Meta AI’s Lama 3.1 405b toont indrukwekkende resultaten in vroege benchmarks. Het overtreft GPT-4 in verschillende tests, waaronder GSM8K, Hellaswag, Boolq en verschillende MMLU-categorieën. Het blijft echter achter op gebieden als HumanEval en MMLU sociale wetenschappen.
De prestaties van het model zijn met name sterk in wiskunde- en coderingstaken. Bijvoorbeeld, in de GSM8K-test scoorde Meta AI’s Llama 3.1 405b 96,8, terwijl zijn 70B-tegenhanger 94,8 behaalde. In HumanEval behaalde het 405B-model 85,3, vergeleken met 79,3 voor de 70B-versie.
Deze cijfers zijn gebaseerd op het basismodel. Instructie-afstemming zou deze resultaten mogelijk nog verder kunnen verbeteren. We kunnen dus zeggen dat deze cijfers de verwerkingskracht vertegenwoordigen, hoe groter het getal hoe beter (maar soms), maar soms worden de modellen verpletterd onder hun belasting.
Op weg naar de toekomst: Meta AI’s Llama 3.1 405b en open-source AI
Het feit dat Meta AI’s Llama 3.1 405b model open-source AI is en dat voor het eerst een open-source model de beste closed source LLM die beschikbaar is in verschillende benchmarks kan verslaan, kan een teken zijn van wat komen gaat, ook al wordt dat op dit moment nog niet helemaal begrepen. Voor nu kunnen we onze GPT’s in ChatGPT maken. Deze afhankelijkheid kan in de toekomst worden verbroken.
Meta AI’s Llama 3.1 405b is een sterke nieuwe speler in de AI-ruimte. De sterke prestaties op verschillende benchmarks en open-source aard maken het een model om in de gaten te houden. Naarmate AI zich blijft ontwikkelen, kan Meta AI’s Llama 3.1 405b een belangrijke rol spelen bij het vormgeven van de toekomst van taalmodellen en AI-technologie.
Bron van de hoofdafbeelding: Meta AI-blog
Source: Meta AI’s Llama 3.1 405b haalt benchmarks