OpenAI kondigde de ontwikkeling aan van een groot taalmodel genaamd GPT-Rosalind, specifiek getraind in algemene biologieworkflows. Het model, genoemd naar bioloog Rosalind Franklin, vertegenwoordigt een gespecialiseerde benadering van biologische data-analyse en onderscheidt het van meer generieke modellen die doorgaans door grote technologiebedrijven worden gebruikt.

Yunyun Wang, Life Sciences Product Lead van OpenAI, verklaarde dat GPT-Rosalind aanzienlijke obstakels in biologisch onderzoek aanpakt. De eerste uitdaging komt voort uit de enorme datasets die zijn geproduceerd door tientallen jaren van genoomsequencing en eiwitbiochemie. De tweede uitdaging betreft de specialisatie van de vele deelgebieden van de biologie, elk gekenmerkt door unieke technieken en specifiek jargon.

Genetici kunnen bijvoorbeeld problemen ondervinden bij het navigeren door de uitgebreide neurobiologische literatuur met betrekking tot specifieke genen die actief zijn in hersencellen. Wang merkte op dat OpenAI GPT-Rosalind heeft getraind in 50 van de meest voorkomende biologische workflows en in het toegang krijgen tot grote openbare databases met biologische informatie.

Het model is uitgerust om potentiële biologische routes te suggereren en prioriteit te geven aan medicijndoelen. “We verbinden genotype met fenotype via bekende routes en regulerende mechanismen, waarbij we waarschijnlijke structurele of functionele eigenschappen van eiwitten afleiden, en echt gebruik maken van dit mechanistische begrip,” zei Wang.

  Schaal-AI breidt zich uit naar RL-omgevingen voor AI-agenten

Aanbevolen afbeeldingscredits