Artificiell intelligens (AI) hjälper till att rita om släktträdet av virus. Förutspådda proteinstrukturer med hjälp av AlphaFold och chatbot-inspirerade sådana "Proteinspråkmodeller" har avslöjat överraskande kopplingar i en familj av virus som inkluderar patogener som infekterar människor och nya hot.

En stor del av forskarnas förståelse om viral evolution bygger på att jämföra genom. Den blixtsnabba utvecklingen av virus, särskilt de med RNA-genom, och deras benägenhet att förvärva genetiskt material från andra organismer visar dock att genetiska sekvenser kan dölja djupare och mer avlägsna relationer mellan virus, vilket kan variera beroende på genen som studeras.

Däremot tenderar formerna eller strukturerna hos proteinerna som kodas av virala gener att förändras långsamt, vilket gör det möjligt att upptäcka dessa dolda evolutionära kopplingar. Men fram till tillkomsten av verktyg som AlphaFold, som kan förutsäga proteinstrukturer i stor skala, var det inte möjligt att jämföra proteinstrukturer över en hel familj av virus, säger Joe Grove, en molekylär virolog vid University of Glasgow, Storbritannien.

I en artikel som publicerades denna vecka iNatur 1Grove och hans team visar kraften i ett strukturbaserat tillvägagångssätt för flavivirus - en grupp som inkluderar hepatit C, dengue- och zikavirus, såväl som flera viktiga djurpatogener och arter som kan utgöra nya hot mot människors hälsa.

Hur virus invaderar

Forskarnas förståelse av flavivirusutvecklingen bygger främst på sekvenser av långsamt utvecklande enzymer som kopierar deras genetiska material. Men anmärkningsvärt lite är känt om ursprunget till "viral inträde"-proteiner som flavivirus använder för att komma in i celler och som bestämmer värden de kan infektera. Grove hävdar att denna kunskapslucka kommer att hindra utvecklingen av ett effektivt vaccin mot Hepatit C, som dödar hundratusentals människor varje år.

"På sekvensnivå är saker så olika att vi inte kan säga om de är relaterade eller inte", säger han. "Genombrottet i förutsägelse av proteinstruktur öppnar upp hela frågan, och vi kan se saker ganska tydligt."

Forskarna använde DeepMinds AlphaFold2 -modell och ESMFold, en Strukturera- Förutsägelseverktyg utvecklat av teknikjätten Meta, för att generera mer än 33 000 förutsagda strukturer för proteiner från 458 flavivirusarter. ESMFold bygger på en språkmodell tränad med tiotals miljoner proteinsekvenser. Till skillnad från AlphaFold kräver den bara en ingångssekvens istället för att förlita sig på flera sekvenser av liknande proteiner, vilket kan göra det särskilt användbart för att studera de mest mystiska virusen.

Hepatitis C Virus E1 glycoprotein predicted using ColabFold-AlpahFold2.

De förutsagda strukturerna gjorde det möjligt för författarna att identifiera virala inträdesproteiner vars sekvenser skiljer sig mycket från de för kända flavivirus. De hittade några oväntade kopplingar. Så gruppen av virus som inkluderar hepatit C använder ett system för att infektera celler som liknar vad de upptäckte med pestivirus - en grupp som inkluderar det klassiska svininfluensaviruset, som orsakar hemorragisk feber hos grisar och andra djurpatogener.

De AI-drivna jämförelserna visade att detta indatasystem skiljer sig från det för många andra flavivirus. "För hepatit C och dess släktingar vet vi inte var deras inträdessystem kommer ifrån. Det kunde ha uppfunnits", säger Grove.

Stulen av bakterier

De förutspådda strukturerna visade också att de välstuderade ingångsproteinerna från Zika- och denguevirus har samma ursprung som de från de "konstiga och underbara" flavivirusen med enorma genom, inklusive Haseki-fästingsviruset, som kan orsaka feber hos människor. En annan stor överraskning var upptäckten att vissa flavivirus har ett enzym som verkar ha stulits från bakterier.

"Detta skulle vara utan motstycke", säger virologen Mary Petrone vid University of Sydney, Australien, om det inte vore för hennes teams upptäckt i år av en liknande stöld av en särskilt "konstig och underbar" art av flavivirus 2. "Genetisk piratkopiering kan ha spelat en större roll i utvecklingen av flavivirus än man tidigare trott", tillägger hon.

David Moi, en beräkningsbiolog vid universitetet i Lausanne, Schweiz, säger att flavivirusstudien bara är toppen av ett isberg och att de evolutionära berättelserna om andra virus och till och med vissa cellulära organismer sannolikt kommer att återberättas med hjälp av AI. "Nu när vi kan ta en titt längre behöver alla dessa saker få en liten uppdatering", säger han.