Uzņēmība pret anonīmu gēnu datu bāzēm datu aizsardzības pārkāpumiem

Eine neue Studie zeigt, dass anonyme genetische Datenbanken anfällig sind für Identitätsdiebstahl und Datenschutzverletzungen. Forschende warnen vor den Folgen.
Jauns pētījums parāda, ka anonīmas ģenētiskās datu bāzes ir jutīgas pret identitātes zādzībām un datu aizsardzības pārkāpumiem. Pētnieki brīdina par sekām. (Symbolbild/natur.wiki)

Uzņēmība pret anonīmu gēnu datu bāzēm datu aizsardzības pārkāpumiem

Pētījums ir izraisījis bažas, ka var izmantot sava veida ģenētisko datu bāzi, kuru arvien populārāka ir pētniekiem, lai atklātu dalībnieku identitāti vai savienotu privāto informāciju par veselību ar viņu publiskajiem ģenētiskajiem profiliem.

1 Lai atklātu privātu informāciju par indivīdiem citā pētījumā, "raksta autori.

Rezultāti uzsver grūtības saskaņot pētnieku intereses ar donoru privātumu. "Mūsu genomi ir ļoti identificējoši. Jūs varat daudz pateikt par mums, mūsu īpašībām un mūsu slimības drošinātājiem," saka pētījuma līdzautors Gamze Gürsoy, Bioinformātikas pētnieks Kolumbijas universitātē Ņujorkā. "Jūs varat mainīt savu kredītkartes numuru, ja tas ir publisks, bet jūs nevarat mainīt savu genomu."

Sensitīvi dati

ņemt vērā privātās datus. Tie satur informāciju par ģenētisko aktivitāti, kas ir vidēja lielā šūnu populācijā, nevis par atsevišķām šūnām.

Iepriekš tika uzskatīts, ka vienas šūnu datu kopas nav tik jutīgas pret datu aizsardzības pārkāpumiem, jo ​​starp dažādām šūnām ir "trokšņa" līmenis vai gēnu ekspresijas variācijas. Bet Gürsoy un viņas komanda spēja pierādīt, ka tas tā nav.

Komanda pārbaudīja trīs publiski pieejamās vienas šūnas datu kopas, kurās bija asins šūnas no cilvēkiem ar vilkēdi, hronisku automašīnu slimību. Pētnieki atklāja, ka viņi spēj izmantot datus gēnu ekspresijai, lai prognozētu personas genoma struktūru, apvienojot šīs vērtības ar informāciju par ekspresijas kvantitatīvās pazīmes lokiem (EQTLS). Sīkāka informācija par hromosomas EQTLS variācijām, kas korelē ar gēnu ekspresiju, ir arī publiski pieejama vienas šūnu datu kopās.

Lai pārbaudītu viņu darba ticamību, pētnieki pārbaudīja savas genoma prognozes, pamatojoties uz genoma datu bāzi, kas atbilda izmantotajām šūnām. Viņi varēja sasaistīt lielāko daļu datu ierakstu ar atbilstošo genomu ar precizitātes līmeni virs 80 %.

Pretstatā datiem par gēnu ekspresiju un EQTL, zinātnieki parasti var apskatīt pilnīgas genoma datu bāzes, lai aizsargātu donoru identifikācijas informāciju. Tomēr pētnieki norāda, ka dalībnieka genoma datus varētu būt publiski pieejami kaut kur citur. Piemēram, jūs būtu varējis tos augšupielādēt ģenealoģijas vietnē, kurā lietotāji nosūta DNS paraugus, lai uzzinātu vairāk par viņu nolaišanos. Šajā gadījumā uzbrucējs varētu identificēt personu, kuras šūnas atrodas vienas šūnu datu kopā, analizējot viņu genomu. Tas varētu atklāt personas datus, kas saistīti ar jutīgu iezīmi, piemēram, psihiatriskiem traucējumiem, jo ​​pētījumu dalībnieki bieži tiek izvēlēti, lai pārbaudītu šo sarežģīto apstākļu bioloģiju.

Tādiem datu aizsardzības ievainojumiem varētu būt reālas sekas, piemēram, diskriminācija darba vietā, saka Gürsoy. Tas piebilst, ka noplūdes pat varētu ietekmēt nākamās paaudzes, jo ģenētiskās pazīmes var nodot pēcnācējiem. "Visu, kas par mums ir zināms, veic paaudzes," viņa saka.

Bredlijs Malins, kurš liela mēroga genoma datu apmaiņas apgabalā Vanderbiltas universitātē Nešvilā, Tenesī, pētījumi apraksta pētījumu kā "jaunu paplašinājumu un ieguldījumu literatūrā". Viņš piebilst, ka turpmākajos pētījumos varētu izpētīt, vai genoma datus varētu saistīt arī lielākos datu ierakstos, kas satur tūkstošiem vai miljoniem cilvēku paraugus.

Konkurences intereses

Zinātnieki nav pārliecināti, kā vislabāk risināt bažas par datu aizsardzību. "Pastāv vēlme aizsargāt indivīda privātumu, bet arī vēlmi kolektīvi veicināt medicīniskos pētījumus, un tie diemžēl ir pretrunā viens ar otru," saka Marks Gersteins, kurš pēta Jēlas universitātē Ņūheivenā, Konektikutā, Medic dati. Vienkāršākais risinājums būtu apgrūtināt piekļuvi ģenētiskajiem datiem, bet tas negatīvi ietekmētu pētījumus, viņš saka. "Mums ir jādalās un jāsagatavo lieli informācijas apjomi," viņš skaidro. "Ja mēs visu bloķējam un padarīsim to privātāku, tas tiešām kavē visu procesu."

Savā pētījumā Gürsoy un viņas kolēģi prasa lielāku pārredzamību attiecībā uz riskiem dalībniekiem, kuri dalās ar genoma datiem, un ierosina, ka pētniekiem būtu jānodrošina, ka donori vienojas nodot savus datus. Vēl viens iespējamais veids varētu būt personas datu šifrēšana, ja esat daļa no publiskās datu bāzes. Autori atzīst, ka tas sarežģīs datu ierakstu izveidošanas un gaidīšanas procesu, taču tas uzskata, ka tas varētu palīdzēt aizsargāt dalībnieku privātumu.

  1. Walker, C. R. et al. Šūna https://doi.org/10.1016/j.cell.2024.09.012 (2024).

  2. Lejupielādē atsauces