Meta AI: in dit bericht leggen we uit wat lama 2 is en hoe je het kunt gebruiken. Meta onthulde zijn meest recente Llama 2 large language model (LLM), dat bij het testen andere open-source chatmodellen (inclusief GPT) overtrof op de meeste benchmarks, waaronder behulpzaamheid en veiligheid.
Naast het publiceren van drie alternatieve modellen als onderdeel van de nieuwe release – één getraind op 7 miljard parameters, één op 13 miljard en uiteindelijk een versie van 70 miljard – stelt Meta AI ook “Llama 2 Chat” beschikbaar, een meer verfijnde variant exclusief ontworpen voor conversatie use cases.
Dit is op zichzelf al een technologische prestatie, maar wat intrigerender is, is dat Meta en Microsoft ook een versterking van hun samenwerking hebben aangekondigd, waardoor ontwikkelaars die Microsoft-tools gebruiken, kunnen kiezen tussen Meta’s Llama en OpenAI’s GPT-modellen bij het creëren van AI-ervaringen.
Meta AI: Wat is lama 2?
De transformatorarchitectuur van het auto-regressieve taalmodel Llama 2 is geoptimaliseerd. Engelstalig commercieel en academisch gebruik van Llama 2 is bedoeld. Het wordt geleverd in een verscheidenheid aan vooraf getrainde en nauwkeurig afgestelde varianten, evenals parametergroottes variërend van 7 miljard tot 70 miljard.
Volgens Meta passen de getweakte versies zich aan menselijke voorkeuren voor veiligheid en behulpzaamheid aan via gesuperviseerde fijnafstemming (SFT) en versterkend leren met menselijke feedback (RLHF). 2 biljoen tokens aan gegevens uit openbaar toegankelijke bronnen werden gebruikt om Llama 2 voor te trainen.
Hoewel vooraf getrainde modellen kunnen worden aangepast voor een reeks taken die natuurlijke taal genereren, zijn op maat gemaakte modellen ontworpen voor assistent-achtige gesprekken. Welk model een ontwikkelaar ook kiest, de richtlijnen voor verantwoord gebruik van Meta AI kunnen helpen bij het sturen van eventuele verdere fijnafstemming die nodig kan zijn om de modellen aan te passen en te optimaliseren met de juiste veiligheidsbeperkingen.
Hoe lama 2 te gebruiken?
Er is uitstekend nieuws als je Llama 2 van Meta AI zelf wilt spelen. Huggingface heeft een demo-versie gemakkelijk beschikbaar. Houd u gewoon aan deze eenvoudige stappen:
- Bezoek deze pagina.
- Wanneer u op de website aankomt, scrolt u naar beneden totdat u een sectie ziet die is gemarkeerd met ‘Demo’.
- Er is daar een chatbox. Voer er nu een bericht in.
- Druk op Enter om uw bericht te verzenden.
Via SageMaker JumpStart in de gebruikersinterface van SageMaker Studio en de SageMaker Python SDK hebt u toegang tot de basismodellen. In deze sectie bespreken we het vinden van modellen in SageMaker Studio.
Een geïntegreerde ontwikkelomgeving (IDE) genaamd SageMaker Studio biedt een enkele webgebaseerde visuele interface waarmee u toegang hebt tot tools die speciaal zijn gemaakt om alle ML-ontwikkelingstaken uit te voeren, van het verzamelen van gegevens tot het maken, testen en implementeren van uw ML-modellen. Verwijzen naar Amazon SageMaker Studio voor meer informatie over het installeren en instellen van SageMaker Studio.
Eenmaal in de SageMaker Studio klikt u op Vooraf gebouwde en geautomatiseerde oplossingen om toegang te krijgen tot SageMaker JumpStart, met vooraf getrainde modellen, notebooks en vooraf gebouwde oplossingen.
U kunt zoeken naar oplossingen, modellen, notebooks en andere bronnen op de startpagina van SageMaker JumpStart. In de Foundation Models: Text Generation-carrousel zijn er twee prominente Llama 2-modellen om uit te kiezen. Werk uw SageMaker Studio-versie bij door deze te stoppen en te hervatten als u Llama 2-modellen niet kunt zien. Raadpleeg Studio-apps afsluiten en bijwerken voor meer informatie over versie-updates.
Door Alle modellen voor tekstgeneratie verkennen te selecteren of “lama” in het zoekvak te typen, kunt u ook de overige vier modelvariaties vinden.
Kies de modelkaart om informatie over het model te lezen, inclusief de licentie, de gebruikte trainingsgegevens en gebruiksinstructies. Implementeren en Notebook openen zijn nog twee knoppen die u helpen bij het gebruik van het model.
U moet de licentieovereenkomst voor eindgebruikers en het beleid voor acceptabel gebruik herkennen in een pop-up wanneer u een van beide knoppen selecteert.
Je gaat door naar de volgende fase om het model te gebruiken nadat je het hebt erkend.
Het volgende voorbeeld laat zien hoe lama-modellen kunnen worden gebruikt met weinig-shot in-context leren door het model toegang te geven tot trainingsgegevens. Houd er rekening mee dat we alleen conclusies trekken uit het model dat is ingezet en dat modelgewichten constant blijven.
Input: Vertaal Engels naar Frans:
zeeotter => loutre de mer
pepermunt => menthe poivrée
pluche giraf => giraf peluche
kaas =>Uitgang:
vanaf
chocolade => chocolade
auto => voiture
hamster => hamster
bier => bier
fiets => fiets
banaan => banaan
aardbei => fraise
pizza => pizza
cheeseburger => cheeseburger
ananas => ananas
wortel => wortel
watermeloen => pastèque
walvis => baleine
aubergine => aubergine
kat => chatten
pinguïn => manchot
leeuw => leeuw
olifant => olifant
panda => panda
tijger => tijger
zalm => saumon
eekhoorn => écureuil
kangoeroe => kangourou
schildpad => tortu
octopus => poulpe
kikker => grenouille
varken => cochon
goudvis => rode poisson
tijgerhaai => requin tigre
gorilla => gorilla
dol
Meta-AI
De beschikbaarheid van Llama 2 in de Azure-AI modelbibliotheek werd onthuld door Microsoft op de Microsoft Inspire-conferentie. Nu kunnen programmeurs het gebruiken om te creëren. Bovendien is het ontworpen om lokaal op Windows te werken om workflows voor AI-ontwikkelaars eenvoudiger te maken. AWS-en Amazon SageMaker Jumpstart hub biedt ook Llama 2 aan, en meer leveranciers zullen volgen.
De lancering van een open ecosysteem tussen Microsoft en Meta AI voor verwisselbare AI-frameworks werd ook onthuld. De Open Neural Network Exchange (ONNX)-standaard voor deep learning-modellen werd voor het eerst aangekondigd in 2017 door Meta AI (voorheen Facebook), en toen begon de ontwikkeling.
De twee beloofden de ontwikkeling van open AI aan te moedigen, met name door meer ondernemingen wereldwijd toegang te geven tot fundamentele AI-technologie.
Volgens Meta AI hebben de Llama 2-modellen een red-teaming-proces ondergaan, waarbij werknemers de taak kregen om zwakke punten in de beveiligingsarchitectuur van de modellen te identificeren en hun veiligheid te waarborgen. Bovendien werden externe bronnen gebruikt om ‘vijandige aanwijzingen’ te creëren om te helpen bij het verfijnen van het model.
Het transparantieschema in de onderzoeksartikel detaillering van Llama 2 schetst de nadelen van het model en hoe Meta van plan is hiermee in de toekomst om te gaan. Gebruikers van Llama 2 zijn verplicht zich te houden aan een “acceptabel gebruik”-beleid, dat het gebruik van het model verbiedt om schadelijke code te produceren, de ongeoorloofde overdracht van informatie of materiaal aan minderjarigen toe te staan, of inhoud te produceren die terrorisme promoot. U heeft toegang tot de volledige lijst hier.
Om programmeurs aan te moedigen het taalmodel over te nemen “om moeilijke problemen op te lossen”, heeft Meta de Lama Impact Challengemet meer informatie volgt.
Lees voordat je vertrekt ons artikel: 15 beste Character AI-ideeën om beter van je gesprekken te genieten
Uitgelicht beeldtegoed: Unsplash.
Source: Meta AI: wat is lama 2 en hoe gebruik je het?