Technologiegigant Apple verbrak het stilzwijgen over kunstmatige intelligentie en introduceerde zijn volgende generatie multimodale grote taalmodellen (LLM’s), genaamd MM1.
MM1, dat met succes complexe taken uitvoert zoals het ondertitelen van afbeeldingen, het beantwoorden van visuele vragen en gevolgtrekkingen uit natuurlijke taal, wordt gezien als een belangrijke ontwikkeling in de wereld van kunstmatige intelligentie.
Wat is MM1?
Zoals ik hierboven al zei, is MM1 een multimodaal groottaalmodel dat is ontworpen om afbeeldingen te ondertitelen, visuele vragen te beantwoorden en gevolgtrekkingen uit natuurlijke taal uit te voeren. Het is bedoeld om complexe taken uit te voeren door tekst en visuele gegevens te combineren. Apple-onderzoekers melden dat MM1 veel betere resultaten biedt vergeleken met andere voorlopige trainingsresultaten.
Technische specificaties van MM1
MM1 ondersteunt tot 30 miljard parameters en onderscheidt zich als een modelfamilie die beeld- en tekstgegevens samen kan verwerken. MM1 is getraind in verschillende gegevenstypen, zoals subkoppen van afbeeldingen, afwisselende afbeeldingstekst en alleen tekst, en beschikt over een uitgebreidere informatieverwerkingscapaciteit.
Aan de andere kant geeft de ontwikkeling van MM1 ook aan welk belang Apple hecht aan kunstmatige intelligentie. Apple werkt aan een LLM-framework met de codenaam “Ajax” en inclusief initiatieven zoals DarwinAI, beschouwt kunstmatige intelligentie en machinaal leren als kerntechnologieën. Het bedrijf is van plan om in 2024 de details van zijn werk op dit gebied te delen en een AI-gerichte presentatie te geven op de WWDC-ontwikkelaarsconferentie in juni.
Apple’s MM1 wordt beschouwd als een belangrijke stap voorwaarts op het gebied van multimode LLM’s. Het laat zien dat Apple zijn stilzwijgen over AI verbreekt, wat in de nabije toekomst een belangrijke rol zou kunnen spelen. De ontwikkeling van MM1 zal bijdragen aan de verdere ontwikkeling van kunstmatige intelligentie op gebieden als visuele gegevensverwerking en begrip van natuurlijke taal.
Uitgelichte afbeeldingscredits: Sumudu Mohottige / Unsplash
Source: Apple onthult hun Multimodal LLM: MM1