- OpenAI Voice Engine opent nieuwe mogelijkheden door te laten zien hoe snel AI kan leren de menselijke stem na te bootsen
- Hoewel het klonen van stemmen een revolutie teweeg kan brengen in de communicatie en toegankelijkheid, brengt het ook aanzienlijke risico’s met zich mee, zoals fraude en verkeerde informatie
- De ontwikkeling van stemklonen onderstreept de dringende noodzaak om ethische uitdagingen aan te pakken en misbruik van krachtige AI-technologie te voorkomen
- De manier waarop stemklonen zich ontwikkelt en wordt gereguleerd, zal bepalen hoe we omgaan met technologie en informatie
Met OpenAI Voice Engine kunt u nu uw spraakopnamen klonen. Dankzij een nieuw model van het kunstmatige intelligentiebedrijf OpenAI kun je nu je gesprekken klonen naar kunstmatige intelligentie.
Het model, dat de menselijke stem kan imiteren met een geluidsfragment van 15 seconden, biedt de potentie om op veel verschillende gebieden te worden gebruikt. Hier zijn alle details…
Wat is OpenAI Voice Engine?
OpenAI’s blogpagina laat zien dat dit model je stem kan imiteren met een geluidsfragment van 15 seconden. Ik denk aan veel nuttige toepassingen, zoals leeshulp voor visueel gehandicapten of mensen met leesproblemen, vertaling en nasynchronisatie voor sprekers van verschillende talen, en communicatie voor mensen met spraakproblemen. Het kan ook nieuwe hulpmiddelen bieden voor makers van inhoud en nieuwe onderzoeksmogelijkheden openen op gebieden als het leren van talen en logopedie.
Ik wil echter de ethische en juridische problemen van deze technologie bespreken: het risico van fraude, identiteitsdiefstal, desinformatie en desinformatie, evenals het creëren van deepfake-video’s door middel van stemklonen. OpenAI begrijpt deze zorgen en blijft eraan werken.
De vooruitgang van de technologie voor het klonen van stemmen met de OpenAI Voice Engine roept veel vragen op. Hoe dergelijke krachtige kunstmatige-intelligentiemodellen gecontroleerd en beschermd kunnen worden en hoe ze tegen misbruik kunnen worden beschermd, zal een belangrijke kwestie zijn die de komende jaren moet worden overwogen.
Op de blog kun je trouwens voorbeeldaudio-opnames vinden.
Hoe werkt de OpenAI Voice Engine?
Het werkingsprincipe van Voice Engine is vrij eenvoudig. Eerst uploadt u een opname van de stem die u wilt klonen. Vervolgens analyseert kunstmatige intelligentie deze opname en leert de toon, het ritme, het accent en andere stemkenmerken. Op basis van deze informatie produceert het een synthetische stem die sterk lijkt op de originele stem.
De mogelijkheden die Voice Engine biedt zijn behoorlijk breed. U kunt deze technologie gebruiken om teksten in te spreken zonder dat u een stemacteur nodig heeft, gepersonaliseerde spraakberichten te maken of zelfs uw stem te klonen voor amusementsdoeleinden.
Zoals ik hierboven al zei, is de Voice Engine echter niet zonder potentiële gevaren. Synthetische stemmen kunnen worden gebruikt bij veel frauduleuze activiteiten, zoals telefoonoplichting, identiteitsdiefstal, verkeerde informatie en desinformatie. Om deze reden is OpenAI van plan “autoriteiten en experts” te raadplegen voordat de Voice Engine openbaar wordt gemaakt.
De Voice Engine van OpenAI zou een keerpunt in de stemtechnologie kunnen zijn. Het zal spannend zijn om te zien hoe het nieuwe model zich de komende jaren ontwikkelt.
Uitgelichte afbeeldingscredits: Levart_Photographer / Unsplash
Source: Introductie van OpenAI Voice Engine: Kloon spraak in slechts 15 seconden