De virtuele assistent van Apple, Siri, is geworden een onmisbaar onderdeel van het iOS-ecosysteem, maar de spraakherkenningsmogelijkheden hebben te maken gehad met uitdagingen in rumoerige omgevingen en met vervormde stemmen. Om deze beperkingen aan te pakken, een recente patentaanvraag van Apple heeft licht geworpen op de verkenning van de technologiegigant naar integratie lipleesmogelijkheden in Siri.
Deze baanbrekende functie kan gebruikmaken van bewegingsdetectietechnologie, zoals versnellingsmeters of gyroscopen, detecteren subtiele gezichtsbewegingen en de nauwkeurigheid van spraakopdrachten verbeteren. Hoewel dit patent verwijst naar opwindende mogelijkheden, blijft het onzeker wanneer en hoe Apple van plan is deze nieuwe functie te implementeren.
De logica achter Apple’s patent voor liplezen voor Siri
De patentaanvraag, ingediend in Januari, schetst een systeem dat bewegingsgegevens gebruikt om te bepalen als de mondbewegingen van een gebruiker overeenkomen met gesproken woorden of zinsdelen. In plaats van alleen te vertrouwen op traditioneel spraakherkenningssystemen, waar invloed op kan worden uitgeoefend achtergrondgeluid en put apparaatbronnen uit, Apple’s voorgestelde methode neemt waar gezichtsspiertrillingen, hoofdbewegingen en bewegingen van andere monddelen. Door gebruik te maken van bewegingssensoren, zoals versnellingsmeters en gyroscopen, zou deze innovatieve aanpak mogelijk kunnen worden overwonnen veel van de uitdagingen waarmee de bestaande spraakherkenningstechnologie te maken heeft.
Gevolgen voor meer dan smartphones
Terwijl het octrooi noemt vooral iPhones, het verwijst naar een breder uitvoeringsgebied. Apple stelt zich voor de technologie uit te breiden naar andere apparaten, waaronder AirPods en zelfs “slimme bril,” impliceren een breed scala van potentiële toepassingen. Gezien de stopzetting van Apple met zijn smart glasses-project, lijkt de focus echter te liggen op zijn Vision Pro-headset, die in mysterie gehuld blijft.
De zoektocht naar gegevens
Om deze lipleesmogelijkheid te ontwikkelen, zou Apple nodig hebben aanzienlijke hoeveelheden gegevens over menselijke mondbewegingen. Het creëren van een “stem profiel” voor gebruikers zou in deze behoefte kunnen voorzien. De recente toegankelijkheidsfuncties van Apple, waaronder Live Speech op iOS, maken het verzamelen van stemprofielen van gebruikers mogelijk. Deze profielen zouden als basis kunnen dienen voor een taalmodel trainen die gezichtsbewegingen herkent uit uitgebreide datasets. De voorliefde van het bedrijf om AI subtiel in zijn functies te integreren, komt overeen met het idee om een “transformatortaalmodel” voor lipleesmogelijkheden.
De weg voor ons
Terwijl de patentaanvraag een flinke vooruitgang betekent in spraakherkenningstechnologie, de daadwerkelijke integratie ervan in de producten van Apple blijft onzeker. Apple’s gerenommeerde supply chain-analist, Ming Chi Kuo, wees erop dat de vooruitgang van het bedrijf op het gebied van generatieve AI blijft achter bij concurrenten, en er zijn geen directe aanwijzingen dat dergelijke deep learning-modellen binnenkort in hardwareproducten zullen worden geïntegreerd. Apple’s ontwikkeling van een interne chatbot met de codenaam “Apple GPT” zou kunnen wijzen op mogelijke AI-gerelateerde verbeteringen voor Siri.
Apple’s patentaanvraag onthult plannen voor een liplezende Siri luidt een nieuw tijdperk van spraakherkenningstechnologie in. Door bewegingsdetectietechnologie te onderzoeken als een middel om te verbeteren nauwkeurigheid van spraakopdrachten, Apple toont zijn toewijding aan gebruikerservaringen verfijnen en voorop blijven lopen op het gebied van AI-integratie.
Hoewel de implementatietijdlijn onduidelijk blijft, houdt het concept stand aanzienlijk potentieel voor een revolutie in spraakondersteunde interacties op verschillende Apple-apparaten. Naarmate de toekomst zich ontvouwt, kijken Apple-gebruikers reikhalzend uit naar de dag waarop hun virtuele assistent moeiteloos hun lippen kan lezen en al hun opdrachten kan uitvoeren.
Uitgelichte afbeelding tegoed: Omid Armin / Unsplash
Source: Nieuw Apple-patent is bedoeld om Siri voor te bereiden om je lippen te lezen