Anonyymien geenitietokantojen alttius tietomurroille
Uusi tutkimus osoittaa, että anonyymit geneettiset tietokannat ovat alttiita identiteettivarkauksille ja tietomurroille. Tutkijat varoittavat seurauksista.

Anonyymien geenitietokantojen alttius tietomurroille
Tutkimus on herättänyt huolta siitä, että tutkijoiden keskuudessa yhä suositumpaa geneettistä tietokantaa voitaisiin hyödyntää osallistujien henkilöllisyyden paljastamiseksi tai yksityisten terveystietojen linkittämiseksi heidän julkisiin geneettisiin profiileihinsa.
Yksisoluiset tietojoukot voi sisältää tietoa geenien ilmentymisestä miljoonissa soluissa, jotka on kerätty tuhansilta ihmisiltä. Nämä tiedot ovat usein vapaasti saatavilla ja tarjoavat arvokkaan resurssin tutkijoille, jotka tutkivat sairauksien vaikutuksia solutasolla. Tietojen sanotaan olevan anonymisoituja, mutta tutkimus julkaistiin 2. lokakuuta Cell-lehdessä 1 osoittaa, kuinka yhden tutkimuksen geneettisiä tietoja "voidaan hyödyntää yksityisten tietojen paljastamiseksi toisessa tutkimuksessa", kirjoittajat kirjoittavat.
Tulokset osoittavat, että tutkijoiden etujen ja lahjoittajien yksityisyyden tasapainottaminen on vaikeaa. "Genomimme ovat hyvin tunnistavia. Ne voivat kertoa paljon meistä, ominaisuuksistamme ja alttiudestamme sairauksille", sanoo tutkimuksen toinen kirjoittaja Gamze Gürsoy, bioinformatiikan tutkija Columbia Universitystä New Yorkissa. "Voit vaihtaa luottokorttinumerosi, jos se tulee julkiseksi, mutta et voi muuttaa genomiasi."
Arkaluonteiset tiedot
Tietosuojakysymykset geneettisissä tiedoissa on otettu esille aiemmin, mutta ne ovat keskittyneet ensisijaisesti geneettisten profiilien "bulkkidataan". Ne sisältävät tietoa geeniaktiviteetista, joka on laskettu keskiarvoina suuresta solupopulaatiosta yksittäisten solujen sijaan.
Aikaisemmin ajateltiin, että yksisoluiset tietojoukot eivät olisi yhtä haavoittuvia tietomurroille, koska eri solujen välillä on "kohinaa" tai vaihtelua geenien ilmentymisessä. Mutta Gürsoy ja hänen tiiminsä pystyivät todistamaan, että näin ei ole.
Ryhmä tutki kolmea julkisesti saatavilla olevaa yksisoluista tietojoukkoa, jotka sisälsivät verisoluja ihmisiltä, joilla oli lupus, krooninen autoimmuunisairaus. Tutkijat havaitsivat, että he voisivat käyttää geenien ilmentymisdataa ennustaakseen henkilön genomin rakenteen yhdistämällä nämä arvot tietoihin ekspression kvantitatiivisista piirteistä (eQTL). Yksityiskohdat eQTL:istä – kromosomin variaatioista, jotka korreloivat geenin ilmentymisen kanssa – ovat myös julkisesti saatavilla yksisoluisissa tietoaineistoissa.
Testaakseen työnsä luotettavuutta tutkijat vertasivat genomiennusteitaan käytettyjä soluja vastaavaan genomitietokantaan. He pystyivät linkittämään useimmat tietojoukot vastaavaan genomiin yli 80 prosentin tarkkuudella.
Toisin kuin geenien ilmentymistiedot ja eQTL:t, vain tutkijat voivat tyypillisesti tarkastella täydellisiä genomitietokantoja luovuttajien tunnistamistietojen suojaamiseksi. Tutkijat kuitenkin huomauttavat, että osallistujan genomitiedot voivat olla julkisesti saatavilla muualla. He ovat esimerkiksi saattaneet ladata ne sukututkimussivustolle, jonne käyttäjät lähettävät DNA-näytteitä saadakseen lisätietoja syntyperästään. Tässä tapauksessa hyökkääjä voisi tunnistaa henkilön, jonka solut ovat yksisoluisessa tietojoukossa, analysoimalla hänen genominsa. Tämä voi paljastaa henkilötietoja, jotka liittyvät herkän ominaisuuden, kuten psykiatrisen häiriön, kanssa, koska tutkimukseen osallistujat valitaan usein tutkimaan näiden monimutkaisten tilojen biologiaa.
Tällaisilla tietomurroilla voi olla todellisia seurauksia, kuten syrjintää työpaikalla, Gürsoy sanoo. Hän lisää, että vuodot voivat vaikuttaa jopa tuleviin sukupolviin, koska geneettiset ominaisuudet voivat siirtyä jälkeläisille. "Kaikki, mitä meistä tiedetään, on siirtynyt sukupolvelta toiselle", hän sanoo.
Bradley Malin, joka tutkii laajamittaista genomitietojen jakamista Vanderbiltin yliopistossa Nashvillessä, Tennesseessä, kuvailee tutkimusta "uudeksi lisäykseksi ja panokseksi kirjallisuuteen". Hän lisää, että tulevassa tutkimuksessa voitaisiin selvittää, voitaisiinko genomitietoja linkittää myös suurempiin tietokokonaisuuksiin, jotka sisältävät näytteitä tuhansilta tai miljoonilta ihmisiltä.
kilpailun etuja
Tutkijat eivät ole varmoja, kuinka parhaiten käsitellä yksityisyyttä koskevia huolenaiheita. "On halu suojella yksilön yksityisyyttä, mutta myös halu edistää lääketieteellistä tutkimusta kollektiivisesti, ja valitettavasti nämä ovat ristiriidassa keskenään", sanoo Mark Gerstein, joka tutkii lääketieteellistä datatieteitä Yalen yliopistossa New Havenissa, Connecticutissa. Yksinkertaisin ratkaisu olisi tehdä geneettisen tiedon saatavuudesta vaikeampi, mutta se vaikuttaisi kielteisesti tutkimukseen, hän sanoo. "Meidän on jaettava ja yhdistettävä suuria määriä tietoa", hän selittää. "Jos estämme kaiken ja teemme siitä yksityisempää, se todella haittaa koko prosessia."
Gürsoy ja hänen kollegansa vaativat tutkimuksessaan suurempaa avoimuutta genomitietonsa jakavien osallistujien riskeistä ja ehdottavat, että tutkijoiden tulisi varmistaa, että luovuttajat suostuvat tietojensa jakamiseen. Toinen mahdollinen tapa voisi olla henkilötietojen salaus, jos ne ovat osa julkista tietokantaa. Kirjoittajat myöntävät, että tämä vaikeuttaisi tietueiden luonti- ja ylläpitoprosessia, mutta uskovat, että se voisi auttaa suojaamaan osallistujien yksityisyyttä.
-
Walker, C.R. et ai. Solu https://doi.org/10.1016/j.cell.2024.09.012 (2024).