Google Deepmind CEO Demis Hassabis heeft plannen onthuld om zijn Gemini AI-modellen te integreren met VEO-video-genererende AI-modellen om Gemini’s begrip van de fysieke wereld te verbeteren, zoals bekendgemaakt in een recent podcast-interview.
Volgens Hassabis is Gemini ontworpen om multimodaal te zijn vanaf het begin, met als doel een “Universal Digital Assistant” te creëren die gebruikers kan helpen in real-world scenario’s. “We hebben altijd Gemini, ons funderingsmodel, vanaf het begin multimodaal gebouwd,” legde Hassabis uit, “en de reden dat we dat hebben gedaan [is because] We hebben een visie voor dit idee van een universele digitale assistent, een assistent dat […] Helpt je eigenlijk in de echte wereld. “
De AI -industrie is getuige van een verschuiving naar “Omni” -modellen die meerdere vormen van media kunnen verwerken en genereren, zoals audio, afbeeldingen en tekst. De nieuwste Gemini-modellen van Google kunnen audio, afbeeldingen en tekst produceren, terwijl Chatgpt van OpenAI afbeeldingen kan maken, waaronder artio ghibli-stijl kunst. Amazon heeft ook plannen aangekondigd om later dit jaar een “Any-to-Any” -model te lanceren, wat deze trend verder illustreert.
Deze Omni -modellen vereisen enorme hoeveelheden trainingsgegevens, inclusief afbeeldingen, video’s, audio en tekst. Hassabis gaf aan dat VEO’s videogegevens voornamelijk afkomstig zijn van YouTube, een platform dat eigendom is van Google. “Kortom, door YouTube -video’s te bekijken – veel YouTube -video’s – [Veo 2] Kan, weet je, de fysica van de wereld uitzoeken, ‘verklaarde Hassabis. Google had eerder TechCrunch geïnformeerd dat zijn modellen’ mogelijk ‘zijn getraind op’ sommige ‘YouTube -inhoud in overeenstemming met de overeenkomst met YouTube -makers.
Het is vermeldenswaard dat Google vorig jaar zijn servicevoorwaarden heeft verbreed, deels om toegang te krijgen tot meer gegevens, inclusief YouTube -inhoud, voor het trainen van zijn AI -modellen. Deze stap wordt gezien als een strategische poging om zijn AI -mogelijkheden te versterken door gebruik te maken van zijn enorme repository van online gegevens.
De post Google om Gemini en Veo AI -modellen te combineren, verschenen eerst op TechBriefly.





