Letošnjo nagrado Lasker za temeljne medicinske raziskave sta prejela Demis Hassabis in John Jumper za njun prispevek k ustvarjanju sistema umetne inteligence AlphaFold, ki napoveduje tridimenzionalno strukturo beljakovin na podlagi zaporedja aminokislin prvega reda.
Njihovi rezultati rešujejo problem, ki že dolgo muči znanstveno skupnost, in odpirajo vrata pospešitvi raziskav na biomedicinskem področju. Beljakovine igrajo ključno vlogo pri razvoju bolezni: pri Alzheimerjevi bolezni se zložijo in združijo; pri raku se njihova regulatorna funkcija izgubi; pri prirojenih presnovnih motnjah so disfunkcionalne; pri cistični fibrozi gredo v napačen prostor v celici. To je le nekaj od številnih mehanizmov, ki povzročajo bolezni. Podrobni modeli strukture beljakovin lahko zagotovijo atomske konfiguracije, spodbudijo načrtovanje ali izbiro molekul z visoko afiniteto in pospešijo odkrivanje zdravil.
Strukture beljakovin se običajno določajo z rentgensko kristalografijo, jedrsko magnetno resonanco in krioelektronsko mikroskopijo. Te metode so drage in dolgotrajne. Posledica tega je, da obstoječe 3D baze podatkov o strukturah beljakovin vsebujejo le približno 200.000 strukturnih podatkov, medtem ko je tehnologija sekvenciranja DNK ustvarila več kot 8 milijonov zaporedij beljakovin. V šestdesetih letih prejšnjega stoletja so Anfinsen in sodelavci odkrili, da se lahko 1D zaporedje aminokislin spontano in ponavljajoče zloži v funkcionalno tridimenzionalno konformacijo (slika 1A) in da lahko molekularni "šaperoni" ta proces pospešijo in olajšajo. Ta opažanja vodijo do 60-letnega izziva v molekularni biologiji: napovedovanja 3D strukture beljakovin iz 1D zaporedja aminokislin. Z uspehom projekta Človeški genom se je naša sposobnost pridobivanja 1D zaporedij aminokislin močno izboljšala in ta izziv je postal še bolj nujen.
Napovedovanje struktur beljakovin je težavno iz več razlogov. Prvič, vsi možni tridimenzionalni položaji vsakega atoma v vsaki aminokislini zahtevajo veliko raziskovanja. Drugič, beljakovine v svoji kemijski strukturi maksimalno izkoriščajo komplementarnost za učinkovito konfiguracijo atomov. Ker imajo beljakovine običajno na stotine "donorjev" vodikovih vezi (običajno kisik), ki bi morali biti blizu "akceptorja" vodikove vezi (običajno dušik, vezan na vodik), je lahko zelo težko najti konformacije, kjer je skoraj vsak donor blizu akceptorja. Tretjič, primerov za učenje eksperimentalnih metod je malo, zato je treba razumeti potencialne tridimenzionalne interakcije med aminokislinami na podlagi 1D zaporedij z uporabo informacij o evoluciji ustreznih beljakovin.
Fizika je bila prvič uporabljena za modeliranje interakcije atomov pri iskanju najboljše konformacije, razvita pa je bila tudi metoda za napovedovanje strukture beljakovin. Karplus, Levitt in Warshel so leta 2013 prejeli Nobelovo nagrado za kemijo za svoje delo na področju računalniške simulacije beljakovin. Vendar pa so metode, ki temeljijo na fiziki, računsko drage in zahtevajo približno obdelavo, zato ni mogoče napovedati natančnih tridimenzionalnih struktur. Drug, »na znanju temelječ« pristop je uporaba podatkovnih baz znanih struktur in zaporedij za učenje modelov z umetno inteligenco in strojnim učenjem (AI-ML). Hassabis in Jumper uporabljata elemente fizike in AI-ML, vendar inovativnost in skok v zmogljivosti pristopa izhajata predvsem iz AI-ML. Raziskovalca sta ustvarjalno združila velike javne podatkovne baze z industrijskimi računalniškimi viri, da bi ustvarila AlphaFold.
Kako vemo, da so »rešili« uganko strukturne napovedi? Leta 1994 je bilo ustanovljeno tekmovanje za kritično oceno strukturne napovedi (CASP), ki se odvija vsaki dve leti, da bi spremljali napredek strukturne napovedi. Raziskovalci bodo delili 1D zaporedje proteina, katerega strukturo so nedavno razrešili, vendar rezultati še niso bili objavljeni. Napovedovalec napove tridimenzionalno strukturo z uporabo tega 1D zaporedja, ocenjevalec pa neodvisno presodi kakovost napovedanih rezultatov tako, da jih primerja s tridimenzionalno strukturo, ki jo je zagotovil eksperimentalec (ki jo je zagotovil samo ocenjevalcu). CASP izvaja prave slepe preglede in beleži občasne skoke uspešnosti, povezane z metodološkimi inovacijami. Na 14. konferenci CASP leta 2020 so rezultati napovedi AlphaFold pokazali takšen skok v uspešnosti, da so organizatorji objavili, da je bil problem 3D-napovedi strukture rešen: natančnost večine napovedi je bila blizu natančnosti eksperimentalnih meritev.
Širši pomen je v tem, da delo Hassabisa in Jumperja prepričljivo prikazuje, kako bi lahko AI-ML preoblikoval znanost. Raziskave kažejo, da lahko AI-ML gradi kompleksne znanstvene hipoteze iz več virov podatkov, da lahko mehanizmi pozornosti (podobni tistim v ChatGPT) odkrijejo ključne odvisnosti in korelacije v virih podatkov ter da lahko AI-ML samostojno presoja kakovost svojih rezultatov. AI-ML je v bistvu znanost.
Čas objave: 23. september 2023




