Náchylnosť na anonymné databázy génov pre porušenia ochrany údajov

Náchylnosť na anonymné databázy génov pre porušenia ochrany údajov
Štúdia vyvolala obavy, že druh genetickej databázy, ktorá je čoraz obľúbenejšia u výskumných pracovníkov, by sa mohla využiť na zverejnenie identity účastníkov alebo na prepojenie súkromných zdravotných informácií s ich verejnými genetickými profilmi.
Bunky zozbierané tisíckami ľudí. Tieto údaje sú často voľne prístupné a ponúkajú hodnotný zdroj pre výskumných pracovníkov, ktorí skúmajú účinky chorôb na bunkovej úrovni. Dáta by mali byť anonymizované, ale štúdia uverejnená 2. októbra v časopise Cell 1 Ak chcete odhaliť súkromné informácie o jednotlivcoch v inej štúdii, napísať autorom.
Výsledky zdôrazňujú obtiažnosť zmierenia záujmov výskumných pracovníkov so súkromím darcov. „Naše genómy sú veľmi identifikačné. Môžete povedať veľa o nás, o našich charakteristikách a našich poistkách choroby,“ hovorí spoluautor štúdie Gamze Gürsoy, výskumný pracovník bioinformatiky na Columbia University v New Yorku. „Ak je verejné, môžete zmeniť číslo svojej kreditnej karty, ale nemôžete zmeniť svoj genóm.“
citlivé údaje
Zvážte súkromie v genetických údajoch o údajoch už boli vyjadrené, ale maizované údaje. Obsahujú informácie o genetickej aktivite, ktoré sú priemerné v populácii veľkých buniek a nie o jednotlivých bunkách.
V minulosti sa predpokladalo, že súbory údajov o jednotlivých bunkách neboli také citlivé na porušenia ochrany údajov z dôvodu úrovne „šumu“ alebo variácie génovej expresie medzi rôznymi bunkami. Ale Gürsoy a jej tím boli schopní dokázať, že tomu tak nie je.
Tím skúmal tri verejne dostupné súbory údajov o jednotlivých bunkách, ktoré obsahovali krvinky od ľudí s lupusom, chronické ochorenie automobilov. Vedci zistili, že boli schopní použiť údaje na génovú expresiu na predpovedanie štruktúry genómu osoby kombináciou týchto hodnôt s informáciami o lokusoch kvantitatívnych znakov expresie (EQTL). Podrobnosti o variáciách EQTLS v chromozóme, ktoré korelujú s génovou expresiou-sú tiež verejne prístupné v súboroch dát jednotlivých buniek.
Aby sa otestovala spoľahlivosť ich práce, vedci skontrolovali svoje predpovede genómu založené na databáze genómu, ktorá zodpovedala použitým bunkám. Podarilo sa im prepojiť väčšinu záznamov údajov so zodpovedajúcim genómom s mierou presnosti viac ako 80 %.
Na rozdiel od údajov o génovej expresii a EQTL, kompletné databázy genómu môžu vedci obvykle prezerať iba na ochranu identifikačných informácií pred darcami. Vedci však zdôrazňujú, že údaje o genóme účastníka by mohli byť verejne dostupné niekde inde. Napríklad by ste ich mohli nahrať na webovú stránku Genealogy, na ktorej používatelia posielajú vzorky DNA, aby sa dozvedeli viac o svojom zostupe. V tomto prípade by útočník mohol identifikovať osobu, ktorej bunky sú v súbore údajov s jednou bunkou analýzou ich genómu. To by mohlo odhaliť osobné údaje, ktoré súvisia s citlivou črtou, ako je psychiatrická porucha, pretože účastníci výskumu sú často vybraní na preskúmanie biológie týchto zložitých podmienok.Takáto úrazy na ochranu údajov môžu mať skutočné následky, napríklad diskrimináciu na pracovisku, hovorí Gürsoy. Dodáva, že úniky by mohli mať dokonca vplyv na budúce generácie, pretože genetické vlastnosti môžu byť odovzdané potomkom. „Všetko, čo sa o nás dozviem, vykonávajú generácie,“ hovorí.
Bradley Malin, ktorý v oblasti rozsiahleho výmeny údajov o genóme na Vanderbilt University v Nashville v Tennessee, výskumy, popisuje štúdiu ako „nové rozšírenie a príspevok k literatúre“. Dodáva, že budúci výskum by mohol preskúmať, či by údaje o genóme mohli byť prepojené aj vo väčších záznamoch údajov, ktoré obsahujú vzorky tisícov alebo miliónov ľudí.
Súťažné záujmy
Vedci si nie sú istí, ako najlepšie riešiť obavy o ochranu údajov. „Existuje túžba chrániť súkromie jednotlivca, ale aj túžbu kolektívne propagovať lekársky výskum, a to, bohužiaľ sú v rozpore,“ hovorí Mark Gerstein, ktorý skúma univerzitu v Yale v New Haven, Connecticut, Medic Data. Najjednoduchším riešením by bolo sťažiť prístup k genetickým údajom, ale to by negatívne ovplyvnilo výskum. „Musíme zdieľať a zhromažďovať veľké množstvo informácií,“ vysvetľuje. „Ak všetko zablokujeme a urobíme ho súkromnejším, skutočne bráni celý proces.“
Vo svojej štúdii si Gürsoy a jej kolegovia vyžadujú väčšiu transparentnosť o rizikách pre účastníkov, ktorí zdieľajú svoje údaje o genóme, a naznačujú, že vedci by mali zabezpečiť, aby sa darcovia dohodli na odovzdávaní svojich údajov. Ďalším možným spôsobom by mohlo byť šifrovanie osobných údajov, ak ste súčasťou verejnej databázy. Autori uznávajú, že by to skomplikovalo proces vytvárania a čakania údajov, ale je to názor, že by to mohlo pomôcť chrániť súkromie účastníkov.