Microsoft ontwikkelt Prompt Shields tegen misbruik door AI-chatbots

AI-chatbots zijn nuttig, maar kwetsbaar voor manipulatie door kwaadwillige personen
Microsoft’s Prompt Shields is een technologie die is ontworpen om chatbots proactief te beschermen tegen misbruikaanvallen
Prompt Shields werkt door potentieel gevaarlijke prompts te identificeren en te voorkomen dat deze het gedrag van de chatbot beïnvloeden

Chatbots voor kunstmatige intelligentie worden steeds meer geïntegreerd in ons leven. Van klantenservice tot educatie en entertainment: chatbots brengen veel voordelen met zich mee, maar ook enkele risico’s. Het probleem is dat kwaadwillende mensen deze chatbots voor sinistere doeleinden proberen te gebruiken. Welke stappen worden hiertegen ondernomen, worden er maatregelen genomen?

Microsoft aangekondigd een nieuwe technologie genaamd “Snelle schildenom te voorkomen dat kwaadwillende hackers chatbots voor hun sinistere doeleinden gebruiken en om een oplossing te vinden. Prompt Shields is ontworpen om AI-chatbots te beschermen tegen twee soorten aanvallen. Dus wat is Prompt Shields? Laten we dat eens van dichterbij bekijken.

GTA Online bounty-glitch: hoe dit te verhelpen?

Microsoft ontwikkelt Prompt Shields tegen misbruik door AI-chatbots — AI-chatbots worden steeds meer geïntegreerd in verschillende aspecten van ons leven, wat voordelen en risico’s met zich meebrengt (Afbeelding tegoed)

Wat zijn de Prompt Shields van Microsoft en welke voordelen heeft dit?

De Prompt Shields-technologie van Microsoft is ontworpen om AI-applicaties te beschermen tegen kwaadwillige manipulatie door middel van zorgvuldig vervaardigde gebruikersinvoer.

Zoals ik hierboven al zei, zal deze technologie AI-chatbots beschermen tegen twee soorten aanvallen:

Directe aanvallen: Bij deze aanvallen worden speciale commando’s gebruikt om de chatbot te dwingen iets te doen dat in strijd is met de normale regels en beperkingen. Een persoon kan de chatbot bijvoorbeeld dwingen een kwade actie uit te voeren door een prompt in te voeren met opdrachten als “beveiligingsmaatregelen omzeilen” of “systeem overschrijven“.
Indirecte aanvallen: Bij deze aanvallen probeert een hacker de chatbotgebruiker te misleiden door hem informatie te sturen. Deze informatie kan een e-mail zijn of een document met instructies die zijn ontworpen om de chatbot te exploiteren. Wanneer de gebruiker deze instructies opvolgt, kan de chatbot onbewust een kwaadaardige actie uitvoeren.

Hoe u de kleur van uw app-pictogrammen in iOS 18 kunt wijzigen

Prompt Shields maakt ook gebruik van machine learning en natuurlijke taalverwerking om potentiële bedreigingen in gebruikersprompts en gegevens van derden te vinden en te elimineren.

Naast Prompt Shields introduceerde Microsoft een nieuwe techniek genaamd “Spotlighting”om AI-modellen te helpen geldige AI-prompts beter te onderscheiden van potentieel risicovolle of onbetrouwbare vragen.

De nieuwe technologieën van Microsoft worden beschouwd als een belangrijke stap in het verbeteren van de veiligheid en betrouwbaarheid van AI-chatbots. Het zal heel spannend zijn om te zien hoe deze technologieën chatbots de komende dagen beschermen.

Uitgelichte afbeeldingscredits: Barış Selman / DALL-E 3

Source: Microsoft ontwikkelt Prompt Shields tegen misbruik door AI-chatbots

Microsoft ontwikkelt Prompt Shields tegen misbruik door AI-chatbots

Wat zijn de Prompt Shields van Microsoft en welke voordelen heeft dit?

© 2021 TechBriefly is a Linkmedya brand.

Follow Us