TechBriefly NL
  • Tech
  • Business
  • Geek
  • How to
  • about
    • Sur Tech Briefly
    • Modalités et Conditions
    • Politique de Confidentialité
    • Contact Us
No Result
View All Result
TechBriefly NL
No Result
View All Result
Home Tech
OpenAI introduceert CriticGPT om code te debuggen die door ChatGPT is gegenereerd

OpenAI introduceert CriticGPT om code te debuggen die door ChatGPT is gegenereerd

byBarış Selman
28/06/2024
in Tech
Reading Time: 3 mins read
Share on FacebookShare on Twitter

OpenAI heeft een nieuw GPT-4-gebaseerd model ontwikkeld, CriticGPT, wat een belangrijke stap is in de richting van het evalueren van de output die wordt geproduceerd door geavanceerde AI-systemen. Het model is ontworpen om fouten in ChatGPT-code te detecteren.

Onderzoek heeft aangetoond dat wanneer mensen ChatGPT-code onderzoeken met behulp van CriticGPT, ze 60% beter presteren dan mensen zonder hulp. OpenAI wil trainers ondersteuning bieden met kunstmatige intelligentie door vergelijkbare modellen te integreren in het labelproces ‘Reinforcement Learning from Human Feedback’ (RLHF). Dus wat is deze CriticGPT? Laten we eens nader bekijken.

Wat is CriticGPT en wat doet het?

CriticGPT speelt een belangrijke rol in het RLHF-proces. Naarmate de redeneer- en gedragsvaardigheden van ChatGPT verbeteren, worden de fouten subtieler en moeilijker voor AI-trainers om op te merken, en CriticGPT, als een model dat is getraind om kritieken te schrijven die onnauwkeurigheden in ChatGPT-reacties benadrukken, helpt trainers problemen op te sporen in door modellen geschreven reacties zonder de hulp van AI. Door mensen CriticGPT te laten gebruiken, kan de AI hun vaardigheden vergroten, wat leidt tot grondigere kritieken en modellen met minder hallucinerende fouten. Voor meer informatie kunt u terecht deze link.

  Reddit cryptocurrency MOON: wat u moet weten

We hebben een tabel samengesteld met enkele kenmerken van CriticGPT die onze aandacht trokken:

FunctieBeschrijving
FoutidentificatieIdentificeert fouten in de code-uitvoer van ChatGPT, inclusief subtiele fouten.
Kritiek genererenGenereert kritieken die onjuistheden in ChatGPT-antwoorden benadrukken.
Menselijke augmentatieVergroot de vaardigheden van menselijke trainers, wat resulteert in uitgebreidere kritieken dan mensen alleen.
Verminderde hallucinatiesProduceert minder hallucinaties (valse positieven) en nitpicks (nutteloze kritiek) dan ChatGPT.
Verbeterde RLHF-labelingVerbetert de efficiëntie en nauwkeurigheid van RLHF-labeling door expliciete AI-ondersteuning te bieden.
Testtijd zoekenMaakt gebruik van aanvullende zoekacties tijdens de testperiode om langere en uitgebreidere kritieken te genereren.
Precisie-terugroepconfiguratieMaakt het mogelijk om een ​​afweging te maken tussen de hallucinatiesnelheid en het aantal gedetecteerde bugs.

De training van CriticGPT wordt uitgevoerd volgens de RLHF-methode. Maar in tegenstelling tot ChatGPT ziet CriticGPT veel invoer met fouten die het vervolgens moet bekritiseren. De AI-trainers voegen handmatig bugs toe aan de door ChatGPT geschreven code en schrijven vervolgens voorbeeldfeedback alsof ze de bug hebben opgemerkt die ze hebben toegevoegd. Door meerdere kritiekpunten op de gewijzigde code te vergelijken, kan dezelfde persoon gemakkelijk herkennen wanneer een kritiekpunt de toegevoegde bug heeft ontdekt. De experimenten onderzoeken of CriticGPT ingevoegde bugs en “natuurlijk voorkomende” ChatGPT-bugs onderschept die door een vorige trainer zijn opgemerkt. CriticGPT-kritieken hebben 63% van de tijd de voorkeur van instructeurs boven ChatGPT-kritieken vanwege natuurlijk voorkomende fouten.

  Samsung -berichten Satellietmodus vindt nog niet plaats
OpenAI introduceert CriticGPT om code te debuggen die door ChatGPT is gegenereerd
CriticGPT is getraind met behulp van de RLHF-methode, waarbij fouten in de code van ChatGPT worden geïdentificeerd (Afbeelding tegoed)

CriticGPT heeft ook enkele beperkingen. Het model is getraind op korte ChatGPT-reacties. Om in de toekomst langere en complexere taken te kunnen begeleiden, moeten er methoden worden ontwikkeld om trainers te helpen deze taken te begrijpen. Ook hallucineren modellen nog steeds en maken trainers soms labelfouten nadat ze deze hallucinaties hebben gezien. In sommige gevallen kunnen fouten in de echte wereld over veel delen van een antwoord worden verspreid. OpenAI benadrukt de behoefte aan betere tools om steeds complexere AI-systemen uit te lijnen. Het onderzoek naar CriticGPT toont het potentieel van het toepassen van RLHF op GPT-4 om mensen te helpen betere RLHF-gegevens voor GPT-4 te genereren. OpenAI is van plan dit werk verder op te schalen en in de praktijk te brengen.


Bron van de hoofdafbeelding: OpenAI

Source: OpenAI introduceert CriticGPT om code te debuggen die door ChatGPT is gegenereerd

  Beste spel om mobiele NFT-spellen te verdienen

Related Posts

Google introduceert AI Inbox om Gmail-taken en updates te organiseren

Google introduceert AI Inbox om Gmail-taken en updates te organiseren

YouTube updatet zoekfilters om Shorts te scheiden van lange video's

YouTube updatet zoekfilters om Shorts te scheiden van lange video's

Disney+ brengt scrollen in TikTok-stijl naar zijn streaming-app

Disney+ brengt scrollen in TikTok-stijl naar zijn streaming-app

FIFA en TikTok werken samen om live WK-clips te streamen

FIFA en TikTok werken samen om live WK-clips te streamen

Google introduceert AI Inbox om Gmail-taken en updates te organiseren
Tech

Google introduceert AI Inbox om Gmail-taken en updates te organiseren

YouTube updatet zoekfilters om Shorts te scheiden van lange video's
Tech

YouTube updatet zoekfilters om Shorts te scheiden van lange video's

Disney+ brengt scrollen in TikTok-stijl naar zijn streaming-app
Tech

Disney+ brengt scrollen in TikTok-stijl naar zijn streaming-app

FIFA en TikTok werken samen om live WK-clips te streamen
Tech

FIFA en TikTok werken samen om live WK-clips te streamen

Xbox onthult line-up voor de volgende Developer Direct: Fable, Forza en meer
Tech

Xbox onthult line-up voor de volgende Developer Direct: Fable, Forza en meer

TechBriefly NL

© 2021 TechBriefly is a Linkmedya brand.

  • About
  • Blog
  • Contact
  • Contact Us
  • Cover Page
  • Modalités et Conditions
  • Politique de Confidentialité
  • Sur Tech Briefly
  • TechBriefly

Follow Us

No Result
View All Result
  • Tech
  • Business
  • Geek
  • How to
  • about
    • Sur Tech Briefly
    • Modalités et Conditions
    • Politique de Confidentialité
    • Contact Us

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.