Dovzetnost za anonimne baze podatkov za kršitve varstva podatkov

Eine neue Studie zeigt, dass anonyme genetische Datenbanken anfällig sind für Identitätsdiebstahl und Datenschutzverletzungen. Forschende warnen vor den Folgen.
Nova študija kaže, da so anonimne genetske baze podatkov dovzetne za krajo identitete in kršitve varstva podatkov. Raziskovalci opozarjajo na posledice. (Symbolbild/natur.wiki)

Dovzetnost za anonimne baze podatkov za kršitve varstva podatkov

Študija je sprožila pomisleke, da bi lahko nekakšno genetsko bazo podatkov, ki je vse bolj priljubljena pri raziskovalcih, izkoristiti za razkritje identitete udeležencev ali povezavo zasebnih zdravstvenih informacij s svojimi javnimi genetskimi profili.

telesno povezavo"> Posamezne povezave s telesom "telesno povezavo"> Posamezne povezave s telesom "telesno povezavo"> Posamezne povezave s telesom "telesa, ki se pojavljajo posamezni povezavi s telesno povezavo"> Posamezne povezave s telesom "telesa, ki se pojavljajo posamezni povezavi s telesnimi povezavami. milijone celic, ki jih je zbralo na tisoče ljudi. Ti podatki so pogosto prosto dostopni in ponujajo dragocen vir za raziskovalce, ki preučujejo učinke bolezni na celični ravni. Podatke je treba anonimizirati, vendar študija, objavljena 2. oktobra v reviji celice 1 Odkriti zasebne informacije o posameznikih v drugi študiji, "napišite avtorje.

Rezultati poudarjajo težave pri usklajevanju interesov raziskovalcev z zasebnostjo donatorjev. "Naši genomi so zelo prepoznavni. Lahko poveš veliko o nas, naših značilnostih in naših varovanjih za bolezen," pravi soavtor študije, Gamze Gürsoy, raziskovalec bioinformatike na univerzi Columbia v New Yorku. "Če je javna, lahko spremenite številko kreditne kartice, vendar ne morete spremeniti genoma."

Občutljivi podatki

V preteklosti se je mislilo, da nabori podatkov z eno celico niso tako dovzetni za kršitve varstva podatkov, zaradi stopnje "hrupa" ali variacije genske ekspresije med različnimi celicami. Toda Gürsoy in njena ekipa sta lahko dokazala, da temu ni tako.

Skupina je pregledala tri javno dostopne nabore podatkov z eno celico, ki so vsebovali krvne celice ljudi z lupusom, kronično avtomobilsko bolezen. Raziskovalci so ugotovili, da lahko podatke za gensko izražanje uporabijo za napovedovanje strukture genoma osebe s kombiniranjem teh vrednosti z informacijami o kvantitativnih lokusih lastnosti (EQTL). Podrobnosti o variacijah EQTLS v kromosomu, ki so v korelaciji z gensko ekspresijo-so tudi javno dostopne v naborih podatkov z eno celico.

Da bi preizkusili zanesljivost svojega dela, so raziskovalci preverili svoje napovedi genoma na podlagi baze podatkov o genomu, ki ustreza uporabljenim celicam. Z ustreznim genomom so lahko povezali večino zapisov podatkov, s stopnjo natančnosti nad 80 %.

V nasprotju s podatki o genski ekspresiji in EQTL -jih lahko celotne baze podatkov o genomu običajno ogledajo le znanstveniki, da zaščitijo identifikacijske podatke pred donatorji. Vendar raziskovalci poudarjajo, da bi bili podatki o genomu udeleženca lahko javno dostopni nekje drugje. Na primer, lahko bi jih naložili na rodoslovno spletno mesto, na katerem uporabniki pošiljajo vzorce DNK, če želite izvedeti več o njihovem spustu. V tem primeru bi lahko napadalec identificiral osebo, katere celice so v enem samem celičnem nastavitvi z analizo njihovega genoma. To bi lahko odkrilo osebne podatke, ki so povezane z občutljivo značilnostjo, kot je psihiatrična motnja, saj so udeleženci raziskav pogosto izbrani za preučevanje biologije teh zapletenih pogojev.

Poškodbe varstva podatkov bi lahko imele resnične posledice, kot je diskriminacija na delovnem mestu, pravi Gürsoy. Dodaja, da bi lahko puščanje celo vplivalo na prihodnje generacije, saj se lahko genetske značilnosti prenesejo na potomce. "Vse, kar o nas pozna, izvajajo generacije," pravi.

Bradley Malin, ki na področju obsežne izmenjave genomov na univerzi Vanderbilt v Nashvillu v Tennesseeju, raziskave, opisuje študijo kot "novo razširitev in prispevek k literaturi". Dodaja, da bi lahko prihodnje raziskave preučile, ali bi lahko podatki genoma povezali tudi v večjih zapisih podatkov, ki vsebujejo vzorce na tisoče ali milijone ljudi.

Tekmovalni interesi

Znanstveniki niso prepričani, kako se najbolje spoprijeti s pomisleki glede varstva podatkov. "Obstaja želja po zaščiti zasebnosti posameznika, pa tudi želja po kolektivni promociji medicinskih raziskav, ki so na žalost v nasprotju drug z drugim," pravi Mark Gerstein, ki raziskuje na univerzi Yale v New Havenu, Connecticut, Medic Data. Najpreprostejša rešitev bi bila otežitev dostopa do genetskih podatkov, vendar bi to negativno vplivalo na raziskave, pravi. "Moramo deliti in zbirati velike količine informacij," pojasnjuje. "Če vse blokiramo in naredimo bolj zasebno, resnično ovira celoten postopek."

V svoji raziskavi Gürsoy in njeni sodelavci zahtevajo večjo preglednost tveganj za udeležence, ki delijo podatke o genom, in predlagajo, da bi raziskovalci zagotovili, da se donatorji strinjajo, da bodo posredovali svoje podatke. Drug možen način bi lahko bila šifriranje osebnih podatkov, če ste del javne baze podatkov. Avtorji priznavajo, da bi to zapletlo postopek ustvarjanja in čakanja na podatke, vendar meni, da bi lahko pomagal zaščititi zasebnost udeležencev.

    >
  1. Walker, C. R. et al. Cell https://doi.org/10.1016/j.cell.2024.09.012 (2024).

    članek Download references