VASA-1 van Microsoft brengt foto's tot leven: alles wat u moet weten

Terwijl AI-technologieën zich snel ontwikkelen en de grenzen verleggen, kan het nieuwe project van Microsoft, VASA-1, foto’s omzetten in video’s en er realistische geluiden aan toevoegen. Ja, dat heb je goed gehoord.

Deze opwindende technologie maakt gebruik van een portretfoto en een audiobestand om een pratende gezichtsvideo te creëren met realistische lipsynchronisatie, gezichtsuitdrukkingen en hoofdbewegingen.

De beloofde kracht van VASA-1 roept enkele zorgen op die ervoor zorgen dat Microsoft aarzelt om het vrij te geven. Dit is wat we weten…

VASA-1’s capaciteiten en impact

Het meest opvallende kenmerk van VASA-1 is het vermogen om levensechte gezichtsanimaties te produceren. In tegenstelling tot eerdere AI-modellen biedt VASA-1 een natuurlijker uiterlijk door fouten rond de mond te minimaliseren. Dit zou ertoe kunnen leiden dat realistischere deepfake-video’s zich op grotere schaal online verspreiden.

Met de nieuwe technologie van Microsoft zijn hoogwaardige en realistische resultaten mogelijk. De demovideo’s van het bedrijf bieden indrukwekkende voorbeelden die de grenzen tussen realiteit en door AI gegenereerde inhoud vervagen.

U kunt Windows 7 nog steeds gratis upgraden naar 10, zegt Microsoft-medewerker

Het zal interessant zijn om te zien wat OpenAI’s Sora en Microsoft’s VASA-1 de komende jaren voor ons in petto hebben…

Het bedrijf legde het in een blogpost als volgt uit:

Let op: alle portretafbeeldingen op deze pagina zijn virtuele, niet-bestaande identiteiten gegenereerd door StyleGAN2 of DALL·E-3 (behalve Mona Lisa). We onderzoeken het genereren van visuele emotionele vaardigheden voor virtuele, interactieve karakters die GEEN echte persoon nabootsen. Dit is slechts een onderzoeksdemonstratie en er zijn geen plannen om producten of API’s uit te brengen.

De toepassingsgebieden van VASA-1

De toepassingen van VASA-1 zijn enorm en kunnen de grenzen van creativiteit verleggen. Het kan bijvoorbeeld worden gebruikt om verbeterde game-ervaringen te bieden. Het realistischer maken van in-game personages met gesynchroniseerde lipbewegingen en expressieve gezichtsuitdrukkingen zou de gamewereld kunnen transformeren. Zelfs nu zijn de personages in games ongelooflijk geoptimaliseerd. Met deze technologie zullen ze echter waarschijnlijk nog verder verbeteren.

ASUS ROG Phone 5 wordt de eerste smartphone met maximaal 18GB RAM

Aan de andere kant kunnen er ook gepersonaliseerde virtuele avatars worden gemaakt. Gebruikers kunnen een verschil maken op sociale media door realistische avatars te maken die hun eigen uiterlijk weerspiegelen. Ook de filmindustrie zou verrassende veranderingen kunnen meemaken. VASA-1 zou de grenzen van het filmmaken kunnen verleggen door realistische close-ups, gezichtsuitdrukkingen en natuurlijke dialoogsequenties te creëren.

Hoe technologie werkt en de toekomst

Microsoft zegt dat VASA-1 een nieuw raamwerk biedt voor het creëren van realistische pratende gezichten en het animeren van virtuele karakters. De technologie heeft tot doel indrukwekkende resultaten te bereiken met alleen een portretfoto en een audiobestand. Het wijdverbreide gebruik van deze technologie roept echter enige zorgen op. Vooral het potentieel om technologieën zoals deepfake te misbruiken, dwingt Microsoft tot voorzichtigheid.

Een van de uitdagingen waarmee Microsoft wordt geconfronteerd, is het balanceren van innovatie en verantwoordelijkheid. Het bedrijf erkent de potentiële voordelen die technologie met zich meebrengt, hanteert een verantwoorde benadering van de ontwikkeling en probeert gebruikers te informeren over de potentiële gevaren. Op deze manier wil het de verspreiding van een krachtige technologie zoals VASA-1 onder controle houden en de algehele veiligheid van de samenleving garanderen.

Canva voegt AI-text-to-video-tool toe aangedreven door Veo 3

Uitgelichte afbeeldingscredits: Microsoft

Source: VASA-1 van Microsoft brengt foto’s tot leven: alles wat u moet weten