Kunstig intelligens (AI) er med på å tegne slektstreet til virus på nytt. Forutsagt proteinstrukturer ved hjelp av AlphaFold og chatbot-inspirerte "Proteinspråkmodeller" har avdekket overraskende forbindelser i en familie av virus som inkluderer patogener som infiserer mennesker og nye trusler.

En stor del av forskernes forståelse om viral evolusjon er basert på å sammenligne genomer. Imidlertid viser den lynraske utviklingen av virus, spesielt de med RNA-genom, og deres tilbøyelighet til å skaffe genetisk materiale fra andre organismer at genetiske sekvenser kan skjule dypere og fjernere forhold mellom virus, som kan variere avhengig av genet som studeres.

I kontrast har formene eller strukturene til proteinene kodet av virale gener en tendens til å endre seg sakte, noe som gjør det mulig å oppdage disse skjulte evolusjonære forbindelsene. Men før bruken av verktøy som AlphaFold, som kan forutsi proteinstrukturer i stor skala, var det ikke mulig å sammenligne proteinstrukturer på tvers av en hel familie av virus, sier Joe Grove, en molekylær virolog ved University of Glasgow, Storbritannia.

I en artikkel publisert denne uken iNatur 1Grove og teamet hans demonstrerer kraften til en strukturbasert tilnærming til flavivirus - en gruppe som inkluderer hepatitt C, dengue- og Zika-virus, samt flere viktige dyrepatogener og arter som kan utgjøre nye trusler mot menneskers helse.

Hvordan virus invaderer

Forskernes forståelse av flavivirus-evolusjon er først og fremst basert på sekvenser av langsomt utviklende enzymer som kopierer deres genetiske materiale. Imidlertid er bemerkelsesverdig lite kjent om opprinnelsen til "viral entry"-proteinene som flavivirus bruker for å gå inn i celler og som bestemmer verten de kan infisere. Grove hevder at dette kunnskapsgapet vil hindre utviklingen av en effektiv vaksine mot Hepatitt C, som dreper hundretusenvis av mennesker hvert år.

"På sekvensnivå er ting så divergerende at vi ikke kan si om de er relatert eller ikke," sier han. "Gjennombruddet i prediksjon av proteinstruktur åpner hele spørsmålet, og vi kan se ting ganske klart."

Forskerne brukte DeepMinds AlphaFold2 -modell og ESMFold, en Struktur- Prediksjonsverktøy utviklet av teknologigiganten Meta, for å generere mer enn 33 000 forutsagte strukturer for proteiner fra 458 flavivirusarter. ESMFold er basert på en språkmodell trent med titalls millioner proteinsekvenser. I motsetning til AlphaFold, krever det bare én inngangssekvens i stedet for å stole på flere sekvenser av lignende proteiner, noe som kan gjøre det spesielt nyttig for å studere de mest mystiske virusene.

Hepatitis C Virus E1 glycoprotein predicted using ColabFold-AlpahFold2.

De forutsagte strukturene gjorde det mulig for forfatterne å identifisere virale inngangsproteiner hvis sekvenser avviker sterkt fra kjente flavivirus. De fant noen uventede forbindelser. Så gruppen av virus som inkluderer hepatitt C bruker et system for å infisere celler som ligner på det de oppdaget med pestivirusene - en gruppe som inkluderer det klassiske svineinfluensaviruset, som forårsaker hemorragisk feber hos griser og andre dyrepatogener.

De AI-drevne sammenligningene viste at dette inngangssystemet er forskjellig fra mange andre flavivirus. "For hepatitt C og dens slektninger vet vi ikke hvor inngangssystemet deres kommer fra. Det kunne vært oppfunnet," sier Grove.

Stjålet av bakterier

De forutsagte strukturene viste også at de godt studerte inngangsproteinene til Zika- og dengue-virus har samme opprinnelse som de til de "rare og fantastiske" flavivirusene med enorme genomer, inkludert Haseki-flåttviruset, som kan forårsake feber hos mennesker. En annen stor overraskelse var oppdagelsen av at noen flavivirus har et enzym som ser ut til å ha blitt stjålet fra bakterier.

"Dette ville vært enestående," sier virolog Mary Petrone ved University of Sydney, Australia, hvis det ikke var for teamets oppdagelse i år av et lignende tyveri av en spesielt "rar og fantastisk" art av flavivirus 2. "Genetisk piratkopiering kan ha spilt en større rolle i utviklingen av flavivirus enn tidligere antatt," legger hun til.

David Moi, en beregningsbiolog ved Universitetet i Lausanne, Sveits, sier at flavivirusstudien bare er toppen av isfjellet, og at de evolusjonære historiene til andre virus og til og med noen cellulære organismer sannsynligvis vil bli gjenfortalt ved bruk av AI. "Nå som vi kan se videre, må alle disse tingene få en liten oppdatering," sier han.