OpenAI heeft realtime videomogelijkheden voor ChatGPT gelanceerd, waarbij visuele functionaliteit wordt geïntegreerd in de Advanced Voice Mode. Deze aankondiging werd gedaan tijdens een livestream-evenement op 12 december 2024. De bijgewerkte versie kan objecten in realtime herkennen via de camera van het apparaat van de gebruiker, visuele informatie verwerken via scherm delen en deelnemen aan mensachtige gesprekken. De update is beschikbaar voor abonnees van ChatGPT Plus, Team en Pro en wordt de komende week uitgerold, waarbij sommige gebruikers in de EU met mogelijke vertragingen te maken krijgen.
Met deze verbetering kan ChatGPT op gebruikers reageren door te interpreteren wat het ziet, zoals het aanbieden van uitleg over instellingen op een apparaat of het geven van suggesties voor het oplossen van wiskundige problemen. Om deze functies te gebruiken, kunnen gebruikers op het stempictogram in de ChatGPT-app tikken en video- of schermdeling activeren. De uitrol heeft prioriteit voor Plus-abonnees, terwijl ChatGPT Enterprise- en Edu-gebruikers in januari 2025 toegang krijgen.
OpenAI toont geavanceerde functies in live demonstratie
Tijdens de recente livedemonstratie benadrukte OpenAI-president Greg Brockman met visie de boeiende mogelijkheden van de Advanced Voice Mode. Brockman ondervroeg Anderson Cooper van CNN over anatomie terwijl hij demonstreerde hoe ChatGPT tekeningen die Cooper op een schoolbord had gemaakt, kon begrijpen en becommentariëren. De interactie illustreerde het potentieel voor realtime, interactief leren en feedback, hoewel ChatGPT enkele fouten vertoonde, zoals het verkeerd berekenen van een geometrieprobleem, wat de voortdurende uitdagingen met betrekking tot de nauwkeurigheid van het model benadrukte.
Deze bijgewerkte functie heeft te maken gehad met vertragingen in de ontwikkeling, waarbij OpenAI eerder zinspeelde op lanceringsvensters die uiteindelijk werden verlengd. Oorspronkelijk gedemonstreerd in mei 2024, werd verwacht dat de Advanced Voice Mode eerder zou arriveren. De recente aankondiging toont het hoogtepunt van de inspanningen om deze mogelijkheid te verfijnen en af te ronden, wat wijst op een strategische focus op het verbeteren van de gebruikerservaring en de technologische mogelijkheden van de chatbot.
Naast de nieuwe visuele functionaliteiten heeft OpenAI voor de feestdagen ook een ‘Santa Mode’ onthuld, waarmee gebruikers op een feestelijke toon met ChatGPT kunnen communiceren. Om toegang te krijgen tot deze functie kunnen gebruikers op het sneeuwvlokpictogram in de applicatie klikken. Deze seizoensoptie stelt de gebruikslimieten voor de eerste interactie opnieuw in, waardoor gebruikers meer mogelijkheden krijgen om deel te nemen aan de feestelijke functie.
Rivalen zoals Google en Meta ontwikkelen soortgelijke mogelijkheden, zoals Google’s Project Astra, dat onlangs beschikbaar is gesteld aan geselecteerde testers op Android. Deze inspanningen weerspiegelen een bredere trend waarin grote technologiebedrijven werken aan het integreren van interactieve videofunctionaliteiten in hun AI-modellen, waardoor de gebruikersbetrokkenheid en de veelzijdigheid van toepassingen worden vergroot.
OpenAI heeft ook plannen aangegeven om andere verbeteringen uit te rollen, zoals het versterken van het Reinforcement Fine-Tuning Research Program, ontworpen om de modelprestaties bij gespecialiseerde taken te optimaliseren. Dit programma is gericht op onderzoeksinstellingen en ondernemingen, waardoor ze OpenAI-modellen kunnen aanpassen voor complexe toepassingen.
Uitgelichte afbeeldingscredits: Open AI
Het bericht OpenAI lanceert realtime videofuncties voor ChatGPT verscheen voor het eerst op TechBriefly.
