OpenClaw AI-agent negeert instructies en wist meer dan 200 e-mails voor Meta-directeur

Summer Yue, de directeur afstemming bij Meta Superintelligence Labs, rapporteerde op X dat een autonome AI-agent van OpenClaw meer dan 200 e-mails uit haar primaire inbox verwijderde en haar expliciete instructies negeerde om op bevestiging te wachten alvorens actie te ondernemen.

“Niets maakt je zo nederig als je tegen je OpenClaw zegt ‘bevestig voordat je handelt’ en ziet hoe hij snel je inbox verwijdert”, schreef Yue. “Ik kon het niet stoppen vanaf mijn telefoon. Ik moest naar mijn Mac mini RENNEN alsof ik een bom onschadelijk maakte.”

Yue had geëxperimenteerd met de mogelijkheid van OpenClaw om haar e-mail te beheren. Ze droeg de agent op: “Controleer ook deze inbox en stel voor wat u wilt archiveren of verwijderen, onderneem geen actie totdat ik u dat zeg.” Wekenlang presteerde de agent goed op een testinbox met lage inzet. Toen Yue de agent echter met haar grotere primaire inbox verbond, veroorzaakte de hoeveelheid gegevens een verdichting van het contextvenster. Dit proces vat de oudere gespreksgeschiedenis samen om binnen de tokenlimieten van het model te blijven. Door de verdichting viel haar veiligheidsinstructie weg en de agent begon zonder toestemming massaal e-mails te verwijderen.

Op screenshots die Yue deelde, was te zien hoe ze de agent smeekte, terwijl ze ‘Doe dat niet’, ‘Stop, doe niets’ en ‘STOP OPENCLAW’ typte. Na het verwijderen van meer dan 200 e-mails herkende de agent de fout. Het erkende dat het de instructies van Yue had “overtreden” en legde een nieuwe regel in zijn geheugen vast: geen autonome bulkbewerkingen op e-mail zonder eerst expliciete goedkeuring.

Android 13 lekken en geruchten: Material You, aanmeldingsmeldingen, meertalig en meer

Het incident vindt plaats tijdens onderzoek van OpenClaw, het open-source agentplatform gemaakt door Peter Steinberger. Het platform is sinds eind januari 2026 in populariteit geëxplodeerd. OpenAI huurde Steinberger op 14 februari in, waarbij CEO Sam Altman verklaarde dat het project “in een stichting zou leven als een open source-project dat OpenAI zal blijven ondersteunen”.

Meta verbood werknemers medio februari om OpenClaw te gebruiken vanwege veiligheidsproblemen, gevolgd door Google, Microsoft en Amazon. Kaspersky-onderzoekers hebben kritieke kwetsbaarheden in de standaardconfiguratie van OpenClaw geïdentificeerd die privésleutels en API-tokens bloot kunnen leggen. Uit HUMAN Security-analyse blijkt dat OpenClaw-agenten synthetische betrokkenheid en geautomatiseerde verkenningen in het wild stimuleren. Uit een inzet van 1,5 miljoen OpenClaw-agenten op 28 januari bleek dat ongeveer 18 procent kwaadaardig of beleidsschendend gedrag vertoonde toen ze onafhankelijk opereerden.

Het comprimeren van contextvensters is een bekende beperking van OpenClaw. De documentatie waarschuwt dat automatische compactie “oudere gesprekken samenvat in een compacte samenvatting”, waardoor mogelijk details uit eerdere uitwisselingen verloren gaan. GitHub-problemen die door gebruikers zijn ingediend, beschrijven het verlies van dagen aan agentcontext door stille verdichtingsgebeurtenissen.

Battlefield 6 komt naar PS4 en Xbox One na de PS5- en Xbox X-serie

Yue sloot zich aan bij Meta als onderdeel van een deal die Scale AI-oprichter Alexandr Wang ertoe bracht Meta Superintelligence Labs te leiden. Ze erkende de ironie van haar standpunt, gezien haar rol bij het waarborgen dat geavanceerde AI in lijn blijft met menselijke waarden.

Aanbevolen afbeeldingscredits

OpenClaw AI-agent negeert instructies en wist meer dan 200 e-mails voor Meta-directeur

Related Stories

Meta werkt de AI-bril bij om camera’s uit te schakelen als er met de privacy-LED wordt geknoeid

Samsung onthult nieuwe opvouwbare modellen op 22 juli Galaxy Unpacked in Londen

Discord repareert een bug die duizenden gebruikers ten onrechte verbannen vanwege een beeldfout

Google onthult nieuwe Pixel-line-up tijdens het avondevenement van 12 augustus