Følsomhet for anonyme gendatabaser for brudd på databeskyttelse

Eine neue Studie zeigt, dass anonyme genetische Datenbanken anfällig sind für Identitätsdiebstahl und Datenschutzverletzungen. Forschende warnen vor den Folgen.
En ny studie viser at anonyme genetiske databaser er mottakelige for brudd på identitetstyveri og brudd på databeskyttelse. Forskere advarer om konsekvensene. (Symbolbild/natur.wiki)

Følsomhet for anonyme gendatabaser for brudd på databeskyttelse

En studie har utløst bekymring for at en slags genetisk database som blir stadig mer populær blant forskere, kan utnyttes for å avsløre deltakernes identitet eller for å koble privat helseinformasjon til sine offentlige genetiske profiler.

1 for å avdekke privat informasjon om enkeltpersoner i en annen studie, "skriv forfatterne.

Resultatene understreker vanskeligheten med å avstemme forskernes interesser med donorers personvern. "Genomene våre er veldig identifiserende. Du kan si mye om oss, våre egenskaper og våre sikringer til sykdom," sier medforfatteren av studien, Gamze Gürsoy, bioinformatikkforsker ved Columbia University i New York City. "Du kan endre kredittkortnummeret ditt hvis det er offentlig, men du kan ikke endre genomet ditt."

Sensitive data

Tidligere trodde man at enkeltcelledatasett ikke var så utsatt for brudd på databeskyttelse, på grunn av nivået av "støy", eller variasjon i genuttrykk, mellom de forskjellige cellene. Men Gürsoy og teamet hennes klarte å bevise at dette ikke er tilfelle.

Teamet undersøkte tre offentlig tilgjengelige enkeltcelledatasett, som inneholdt blodceller fra personer med lupus, kronisk bilsykdom. Forskerne fant at de var i stand til å bruke dataene for genuttrykk for å forutsi strukturen til genomet til en person ved å kombinere disse verdiene med informasjon om ekspresjonskvantitative trekkloki (EQTLS). Detaljene om EQTLS-variasjonene i kromosom, som korrelerer med genuttrykk-er også offentlig tilgjengelig i enkeltcelledatasett.

For å teste påliteligheten av arbeidet sitt, sjekket forskerne deres genomprognoser basert på en genomdatabase som tilsvarte cellene som ble brukt. De var i stand til å koble de fleste dataregistreringer med det tilsvarende genomet, med en nøyaktighetsrate på over 80 %.

I motsetning til dataene om genuttrykk og EQTL -er, kan komplette genomdatabaser vanligvis bare sees av forskere for å beskytte den identifiserende informasjonen fra giverne. Forskerne påpeker imidlertid at genomdataene til en deltaker kan være offentlig tilgjengelig et annet sted. For eksempel kunne du ha lastet opp dem på et slektsnettsted som brukere sender DNA -prøver for å lære mer om deres nedstigning. I dette tilfellet kan en angriper identifisere en person hvis celler er i et enkelt celledatasett ved å analysere genomet deres. Dette kan avdekke personopplysninger som er relatert til et følsomt trekk som en psykiatrisk lidelse, siden forskningsdeltakere ofte blir valgt for å undersøke biologien til disse komplekse forholdene.

Skader på databeskyttelse som dette kan ha reelle konsekvenser, for eksempel diskriminering på arbeidsplassen, sier Gürsoy. Det legger til at lekkasjer til og med kan ha innvirkning på fremtidige generasjoner, siden genetiske trekk kan overføres til etterkommere. "Alt som blir kjent om oss blir videreført av generasjoner," sier hun.

Bradley Malin, som i området storstilt genomdatautveksling ved Vanderbilt University i Nashville, Tennessee, forsker, beskriver studien som en "ny utvidelse og bidrag til litteratur". Han legger til at fremtidig forskning kan undersøke om genomdata også kan kobles til i større dataregistreringer som inneholder prøvene til tusenvis eller millioner av mennesker.

konkurranseinteresser

Forskere er usikre på hvordan de best kan takle bekymringene for databeskyttelse. "Det er et ønske om å beskytte personvernet til individet, men også ønsket om å fremme medisinsk forskning kollektivt, og disse er dessverre i strid med hverandre," sier Mark Gerstein, som forsker på Yale University i New Haven, Connecticut, Medic Data. Den enkleste løsningen ville være å gjøre tilgang til genetiske data vanskeligere, men det vil påvirke forskningen negativt, sier han. "Vi må dele og samle store mengder informasjon," forklarer han. "Hvis vi blokkerer alt og gjør det mer privat, hindrer det virkelig hele prosessen."

I studien deres krever Gürsoy og hennes kolleger større åpenhet om risikoen for deltakerne som deler genomdataene sine og foreslår at forskere bør sikre at giverne samtykker i å videreføre dataene sine. En annen mulig måte kan være kryptering av personopplysninger hvis du er en del av en offentlig database. Forfatterne erkjenner at dette vil komplisere prosessen med å lage og vente dataregistreringer, men det er av den oppfatning at det kan bidra til å beskytte deltakernes personvern.

  1. Walker, C. R. et al. Cell https://doi.org/10.1016/j.cell.2024.09.012 (2024).

    Artikkel