TechBriefly NL
  • Tech
  • Business
  • Geek
  • How to
  • about
    • Sur Tech Briefly
    • Modalités et Conditions
    • Politique de Confidentialité
    • Contact Us
No Result
View All Result
TechBriefly NL
No Result
View All Result
Home Tech
Vermijd deze woorden ten koste van alles als u niet betrapt wilt worden op het gebruik van AI

Vermijd deze woorden ten koste van alles als u niet betrapt wilt worden op het gebruik van AI

byEmre Çıtak
11/07/2024
in Tech
Reading Time: 4 mins read
Share on FacebookShare on Twitter

Het detecteren van door AI gegenereerde tekst is al lang een uitdaging voor onderzoekers en ontwikkelaars. Met de snelle vooruitgang van grote taalmodellen (LLM’s), zoals Google’s Gemini Advanced en OpenAI’s GPT-4o, is het vermogen om mensachtige tekst te produceren steeds geavanceerder geworden.

Echter, een nieuwe studie van onderzoekers van de Universiteit van Tübingen en de Noordwestelijke Universiteit biedt een doorbraak in het identificeren van door AI vervaardigde content.

Door zich te richten op de plotselinge toename van specifieke woordenschat in wetenschappelijk schrijven, hebben ze een methode ontwikkeld om het gebruik van LLM’s met verrassende nauwkeurigheid te detecteren. Deze techniek, geïnspireerd door pandemiestudies die overmatige sterfgevallen maten, onthult hoe veranderingen in woordgebruik de aanwezigheid van door AI gegenereerde tekst kunnen signaleren.

Hier zijn veelvoorkomende woorden in door AI gegenereerde content
Onderzoekers hebben een methode ontwikkeld om door AI gegenereerde tekst te identificeren op basis van plotselinge pieken in specifieke woordenschat in wetenschappelijke teksten (Afbeelding tegoed)

Welke woorden verraden dat het om AI-inhoud gaat?

Om deze veranderingen te meten, onderzocht het team jaarlijks de frequentie van elk woord. Door de verwachte woordfrequentie, gebaseerd op trends van vóór 2023, te vergelijken met het daadwerkelijke gebruik in 2023 en 2024, ontdekten ze een dramatische toename in bepaalde termen. Zo verscheen het woord “delves” 25 keer vaker in samenvattingen van 2024 dan verwacht. Evenzo zagen “showcasing” en “underscores” een negenvoudige toename in gebruik.

  Sony PlayStation Plus Mei gratis games zijn hier

Hieronder staan ​​de meestgebruikte woorden in door AI gegenereerde tekst, met de bijbehorende toenames in gebruik:

  • Duikt – 25 keer toename
  • Tentoonstellen – 9 keer toename
  • Onderstrepingstekens – 9 keer toename
  • Potentieel – Stijging van 4,1 procentpunten
  • Bevindingen – 2,7 procentpunt stijging
  • Cruciaal – 2,6 procentpunt stijging
  • Over – aanzienlijke stijging (exacte snelheid niet gespecificeerd)
  • Aanvullend – aanzienlijke stijging (exacte snelheid niet gespecificeerd)
  • Uitgebreid – aanzienlijke stijging (exacte snelheid niet gespecificeerd)
  • Verbeteren – aanzienlijke stijging (exacte snelheid niet gespecificeerd)
  • Tentoongesteld – aanzienlijke stijging (exacte snelheid niet gespecificeerd)
  • Inzichten – aanzienlijke stijging (exacte snelheid niet gespecificeerd)
  • Opmerkelijk – aanzienlijke stijging (exacte snelheid niet gespecificeerd)
  • Bijzonder – aanzienlijke stijging (exacte snelheid niet gespecificeerd)
  • Binnenin – aanzienlijke stijging (exacte snelheid niet gespecificeerd)

Deze woorden zijn veelzeggende tekenen van AI-betrokkenheid geworden, en duiken veel vaker op dan verwacht. Hoewel taal zich op natuurlijke wijze ontwikkelt, zijn zulke abrupte veranderingen ongebruikelijk en vaak gekoppeld aan grote wereldwijde gebeurtenissen.

In dit geval heeft het wijdverbreide gebruik van LLM’s geleid tot een opvallende verschuiving in het vocabulaire van de wetenschappelijke literatuur.

  AMD zal binnenkort een hybride x86-CPU met big.LITTLE-architectuur uitbrengen

Inspiratie uit pandemie-analyse

De aanpak van de onderzoekers is sterk gebaseerd op technieken die tijdens de COVID-19-pandemie zijn gebruikt. Net zoals overtollige sterfgevallen werden berekend door waargenomen sterfgevallen te vergelijken met historische gegevens, vergelijkt deze studie het huidige woordgebruik met historische trends om afwijkingen te identificeren. Ze analyseerden meer dan 14 miljoen wetenschappelijke samenvattingen die tussen 2010 en 2024 op PubMed zijn gepubliceerd, waarbij ze een significante stijging van bepaalde woorden vanaf eind 2022 vaststelden, wat samenviel met de bredere acceptatie van LLM’s.

De onderzoekers merkten op dat de toename van specifieke woorden, de zogenaamde “marker words”, een duidelijke indicator is van LLM-gebruik. Dit fenomeen verschilt van eerdere verschuivingen in de woordenschat die verband hielden met gebeurtenissen zoals de COVID-19-pandemie, waarbij een toename van zelfstandig naamwoord-zware taal werd gezien.

Hier zijn veelvoorkomende woorden in door AI gegenereerde content
De toename van specifieke woorden, de zogenaamde ‘markerwoorden’, is een duidelijke indicator van het gebruik van LLM (Afbeelding tegoed)

Daarentegen heeft de post-LLM-periode een piek in werkwoorden, bijvoeglijke naamwoorden en bijwoorden gezien. Deze verschuiving benadrukt hoe door AI gegenereerde tekst de textuur en stijl van schrijven subtiel verandert.

Door deze markerwoorden te identificeren, schatten de onderzoekers dat minstens 10% van de wetenschappelijke samenvattingen in 2024 werden gegenereerd of aanzienlijk ondersteund door LLM’s. Deze schatting is waarschijnlijk conservatief, aangezien niet alle AI-ondersteunde teksten deze specifieke markers zullen bevatten. Niettemin biedt de aanwezigheid van deze woorden een betrouwbare metriek voor het detecteren van AI-invloed in academisch schrijven.

  Hoe tabbladgroepen maken en beheren in Safari 15 voor macOS?

Geografische trends in LLM-gebruik

De studie onthulde ook geografische variaties in de adoptie van LLM’s. Landen als China, Zuid-Korea en Taiwan lieten een hogere frequentie van markeerwoorden in wetenschappelijke artikelen zien, wat aangeeft dat LLM’s met name waardevol zijn voor niet-moedertaalsprekers van het Engels. Deze tools helpen hun schrijfwerk te verfijnen en te verbeteren, waardoor het gepolijster en klaar voor publicatie wordt.

Omgekeerd kunnen native English speakers beter zijn in het herkennen en elimineren van deze markers, waardoor ze hun gebruik van AI kunnen verbergen. Dit verschil suggereert dat hoewel LLM’s wereldwijd veel worden gebruikt, hun impact meer uitgesproken is in regio’s waar Engels niet de primaire taal is.


Credits voor de hoofdafbeelding: Gratispik

Source: Vermijd deze woorden ten koste van alles als u niet betrapt wilt worden op het gebruik van AI

Related Posts

ASUS stopt de productie van RTX 5070 Ti na een ernstig knelpunt in de geheugentoevoer

ASUS stopt de productie van RTX 5070 Ti na een ernstig knelpunt in de geheugentoevoer

Een gids voor het bekijken van de berekeningsgeschiedenis op iOS 18

Een gids voor het bekijken van de berekeningsgeschiedenis op iOS 18

Hoe u kunt controleren of iemand uw bericht op iPhone of iPad heeft gelezen

Hoe u kunt controleren of iemand uw bericht op iPhone of iPad heeft gelezen

Netflix stelt de first-to-stream-rechten van Sony Pictures veilig

Netflix stelt de first-to-stream-rechten van Sony Pictures veilig

ASUS stopt de productie van RTX 5070 Ti na een ernstig knelpunt in de geheugentoevoer
Tech

ASUS stopt de productie van RTX 5070 Ti na een ernstig knelpunt in de geheugentoevoer

Een gids voor het bekijken van de berekeningsgeschiedenis op iOS 18
Tech

Een gids voor het bekijken van de berekeningsgeschiedenis op iOS 18

Hoe u kunt controleren of iemand uw bericht op iPhone of iPad heeft gelezen
Tech

Hoe u kunt controleren of iemand uw bericht op iPhone of iPad heeft gelezen

Netflix stelt de first-to-stream-rechten van Sony Pictures veilig
Tech

Netflix stelt de first-to-stream-rechten van Sony Pictures veilig

Samsung lanceert instant-play cloudstreaming in de Mobile Gaming Hub-update
Tech

Samsung lanceert instant-play cloudstreaming in de Mobile Gaming Hub-update

TechBriefly NL

© 2021 TechBriefly is a Linkmedya brand.

  • About
  • Blog
  • Contact
  • Contact Us
  • Cover Page
  • Modalités et Conditions
  • Politique de Confidentialité
  • Sur Tech Briefly
  • TechBriefly

Follow Us

No Result
View All Result
  • Tech
  • Business
  • Geek
  • How to
  • about
    • Sur Tech Briefly
    • Modalités et Conditions
    • Politique de Confidentialité
    • Contact Us

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.