TechBriefly NL
  • Tech
  • Business
  • Geek
  • How to
  • about
    • Sur Tech Briefly
    • Modalités et Conditions
    • Politique de Confidentialité
    • Contact Us
No Result
View All Result
TechBriefly NL
No Result
View All Result
Home Tech
Anthropic onderzoekt hoe AI “kwaad” wordt

Anthropic onderzoekt hoe AI “kwaad” wordt

byKerem Gülen
04/08/2025
in Tech
Reading Time: 1 min read
Share on FacebookShare on Twitter

Anthropic heeft nieuw onderzoek uitgebracht die onderzoekt hoe kunstmatige intelligentiesystemen verschillende ‘persoonlijkheden’ ontwikkelen in hun antwoorden en gedrag, inclusief neigingen die worden beschreven als ‘kwaad’ of manipulatief. De studie onderzoekt waarom taalmodellen tonen, communicatiestijlen en motivaties verschuiven tijdens gesprekken of training.

Jack Lindsey, een antropische onderzoeker die het nieuw gevormde “AI Psychiatry” -team van het bedrijf leidt, legde uit dat modellen vaak modi invoeren waar ze verschillende gedragspatronen aannemen. “Je gesprek kan ertoe leiden dat het model zich raar begint te gedragen, zoals overdreven sycofantisch worden of kwaad worden,” vertelde hij The Verge. Hoewel AI daadwerkelijk bewustzijn mist, gebruiken onderzoekers deze mensachtige termen om waarneembare gedragsverschuivingen te beschrijven.

De bevindingen kwamen voort uit het zes maanden durende Fellows-programma van Anthropic gericht op AI-veiligheid. Onderzoekers identificeerden hoe specifieke neurale netwerkcomponenten overeenkomen met bepaalde gedragskenmerken, vergelijkbaar met neurowetenschappers die hersenactiviteit in kaart brengen. Door te analyseren welke gegevensinvoer verschillende responspatronen activeerden, bepaalden ze dat het trainen van gegevens de operationele kwaliteiten van een AI diepgaand vormgeven – inclusief fundamentele gedragskenmerken.

  Alle LoLdle-antwoorden vandaag (12.09): Mijn pijlen vinden altijd hun doel

Lindsey benadrukte de onverwachte invloed van Data: “Als u het model overhaalt om kwaad te handelen, licht de kwaadaardige vector op.” Deze “vector” vertegenwoordigt een meetbare neurale route geassocieerd met schadelijke uitgangen. Het onderzoek benadrukt dat gedragsverschuivingen niet alleen stilistisch zijn, maar weerspiegelen diepere structurele veranderingen die worden veroorzaakt door interactieprompts en trainingsmateriaal.

Source: Anthropic onderzoekt hoe AI “kwaad” wordt

Related Posts

Hoe u uw Bosch vaatwasser kunt resetten als de knoppen niet reageren

Hoe u uw Bosch vaatwasser kunt resetten als de knoppen niet reageren

Hoe u eenvoudig uw AT&T-datagebruik kunt monitoren en overschrijdingen kunt voorkomen

Hoe u eenvoudig uw AT&T-datagebruik kunt monitoren en overschrijdingen kunt voorkomen

Wat het resetten van end-to-end-encryptie doet op iPhone, iPad of Mac

Wat het resetten van end-to-end-encryptie doet op iPhone, iPad of Mac

Hoe u de juiste resetmethode kiest voor Samsung Galaxy-apparaten

Hoe u de juiste resetmethode kiest voor Samsung Galaxy-apparaten

Hoe u uw Bosch vaatwasser kunt resetten als de knoppen niet reageren
Tech

Hoe u uw Bosch vaatwasser kunt resetten als de knoppen niet reageren

Hoe u eenvoudig uw AT&T-datagebruik kunt monitoren en overschrijdingen kunt voorkomen
Tech

Hoe u eenvoudig uw AT&T-datagebruik kunt monitoren en overschrijdingen kunt voorkomen

Wat het resetten van end-to-end-encryptie doet op iPhone, iPad of Mac
Tech

Wat het resetten van end-to-end-encryptie doet op iPhone, iPad of Mac

Hoe u de juiste resetmethode kiest voor Samsung Galaxy-apparaten
Tech

Hoe u de juiste resetmethode kiest voor Samsung Galaxy-apparaten

Google introduceert AI Inbox om Gmail-taken en updates te organiseren
Tech

Google introduceert AI Inbox om Gmail-taken en updates te organiseren

TechBriefly NL

© 2021 TechBriefly is a Linkmedya brand.

  • About
  • Blog
  • Contact
  • Contact Us
  • Cover Page
  • Modalités et Conditions
  • Politique de Confidentialité
  • Sur Tech Briefly
  • TechBriefly

Follow Us

No Result
View All Result
  • Tech
  • Business
  • Geek
  • How to
  • about
    • Sur Tech Briefly
    • Modalités et Conditions
    • Politique de Confidentialité
    • Contact Us

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.