Citlivost na anonymní genové databáze pro porušení ochrany údajů

Citlivost na anonymní genové databáze pro porušení ochrany údajů
Studie vyvolala obavy, že druh genetické databáze, která je u vědců stále populárnější, by mohla být využita k odhalení identity účastníků nebo propojení soukromých zdravotních informací s jejich veřejnými genetickými profily.
Individual cell data sets can contain information about gene expression in millions of buňky shromážděné tisíci lidí. Tato data jsou často volně přístupná a nabízejí cenný zdroj pro vědce, kteří zkoumají účinky nemocí na buněčné úrovni. Data by měla být anonymizována, ale studie zveřejněná 2. října v buňce časopisu 1 Chcete-li odhalit soukromé informace o jednotlivcích v jiné studii, "Napište autoři.
Výsledky zdůrazňují obtíže při sladění zájmů vědců se soukromí dárců. „Naše genomy se velmi identifikují. Můžete o nás, o našich vlastnostech a našich pojistkách nemoci hodně říci,“ říká spoluautor studie Gamze Gürsoy, výzkumník bioinformatiky na Columbia University v New Yorku. "Můžete změnit číslo své kreditní karty, pokud je veřejná, ale nemůžete změnit svůj genom."
citlivá data
Zvažte soukromí v genetických datových záznamech , ale hlavně se soustředily na "PROFICLIES", "PROFECILS", "PROFECILS", "PROFILY PROFILY", "PROFECILS", "PROFETIONS", "PROFETIONS", "PROFETIONS" PROFECILS "," PROFETIONS "," PROFETIONS "PROFECILS", "PROFETIONS„ PROFILY PROFILY. Ty obsahují informace o genetické aktivitě, která je průměrná ve velké buněčné populaci a ne o jednotlivých buňkách.
V minulosti se předpokládalo, že soubory dat s jedním buňkami nebyly tak náchylné k porušování ochrany dat, kvůli úrovni „šumu“ nebo změny genové exprese mezi různými buňkami. Ale Gürsoy a její tým dokázali dokázat, že tomu tak není.
Tým zkoumal tři veřejně dostupné soubory dat s jedním buňkami, které obsahovaly krvinky od lidí s lupusem, chronickou automobilovou chorobou. Vědci zjistili, že byli schopni použít data pro genovou expresi k predikci struktury genomu osoby kombinací těchto hodnot s informacemi o kvantitativních lokusech exprese (EQTL). Podrobnosti o variacích EQTLS v chromozomu, které korelují s genovou expresí-jsou také veřejně přístupné v souborech dat s jedním buňkami.
Aby se testovala spolehlivost své práce, vědci zkontrolovali své prognózy genomu na základě databáze genomu, která odpovídala použitým buňkám. Byli schopni propojit většinu datových záznamů s odpovídajícím genomem s mírou přesnosti přes 80 %.
Na rozdíl od údajů o genové expresi a EQTLS lze kompletní databáze genomu obvykle prohlížet pouze vědci, aby chránili identifikační informace před dárci. Vědci však poukazují na to, že údaje o genomu účastníka mohou být veřejně dostupné někde jinde. Mohli byste je například nahrát na webovou stránku Genealogy, na kterém uživatelé posílají vzorky DNA, aby se dozvěděli více o jejich sestupu. V tomto případě by útočník mohl identifikovat osobu, jejíž buňky jsou v jednobuněčných datech sadou analýzou jejich genomu. To by mohlo odhalit osobní údaje, které souvisejí s citlivou vlastností, jako je psychiatrická porucha, protože účastníci výzkumu jsou často vybíráni, aby prozkoumali biologii těchto složitých podmínek.Zranění na ochranu údajů, jako je tato, by mohla mít skutečné důsledky, jako je diskriminace na pracovišti, říká Gürsoy. Dodává, že úniky by mohly mít dokonce dopad na budoucí generace, protože genetické rysy mohou být předány potomkům. „Všechno, co se o nás dozví, je prováděno generacemi,“ říká.
Bradley Malin, který v oblasti rozsáhlé výměny dat genomu na Vanderbilt University v Nashville, Tennessee, Researches, popisuje studii jako „nové rozšíření a příspěvek k literatuře“. Dodává, že budoucí výzkum by mohl prozkoumat, zda by data genomu mohla být také propojena ve větších datových záznamech, které obsahují vzorky tisíců nebo miliony lidí.
Zájmy soutěže
Vědci si nejsou jisti, jak nejlépe řešit obavy o ochranu údajů. „Existuje touha chránit soukromí jednotlivce, ale také touha kolektivně propagovat lékařský výzkum, a to je bohužel v rozporu s sebou,“ říká Mark Gerstein, který zkoumá na Yale University v New Haven, Connecticut, Medic Data. Nejjednodušším řešením by bylo ztěžovat přístup k genetickým datům, ale to by negativně ovlivnilo výzkum, říká. „Musíme sdílet a agregovat velké množství informací,“ vysvětluje. "Pokud všechno blokujeme a uděláme to soukromějším, opravdu to brání celému procesu."
Ve své studii Gürsoy a její kolegové vyžadují větší transparentnost o rizicích pro účastníky, kteří sdílejí své údaje o genomu, a navrhují, aby vědci měli zajistit, aby dárci souhlasili s předáním svých údajů. Dalším možným způsobem by mohlo být šifrování osobních údajů, pokud jste součástí veřejné databáze. Autoři uznávají, že by to komplikovalo proces vytváření a čekání datových záznamů, ale je toho názoru, že by to mohlo pomoci chránit soukromí účastníků.
-
walker, C. R. et al. Cell https://doi.org/10.1016/j.cell.2024.09.012 (2024).