Zranitelnost anonymních genových databází vůči únikům dat

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Nová studie ukazuje, že anonymní genetické databáze jsou zranitelné vůči krádežím identity a únikům dat. Vědci varují před následky.

Eine neue Studie zeigt, dass anonyme genetische Datenbanken anfällig sind für Identitätsdiebstahl und Datenschutzverletzungen. Forschende warnen vor den Folgen.
Nová studie ukazuje, že anonymní genetické databáze jsou zranitelné vůči krádežím identity a únikům dat. Vědci varují před následky.

Zranitelnost anonymních genových databází vůči únikům dat

Studie vyvolala obavy, že typ genetické databáze, která je mezi výzkumníky stále oblíbenější, by mohl být zneužit k odhalení identity účastníků nebo propojení soukromých zdravotních informací s jejich veřejnými genetickými profily.

Datové sady jedné buňky může obsahovat informace o genové expresi v milionech buněk odebraných od tisíců lidí. Tato data jsou často volně dostupná a poskytují cenný zdroj pro výzkumníky studující účinky onemocnění na buněčné úrovni. Data jsou prý anonymizovaná, ale studie zveřejněná 2. října v časopise Cell 1 ukazuje, jak genetická data z jedné studie „mohou být zneužita k odhalení soukromých informací o jednotlivcích v jiné studii,“ píší autoři.

Výsledky zdůrazňují obtížnost vyvažování zájmů výzkumníků a soukromí dárců. "Naše genomy jsou velmi identifikující. Mohou o nás hodně říci, o našich vlastnostech a náchylnosti k nemocem," říká spoluautorka studie Gamze Gürsoyová, výzkumnice v oblasti bioinformatiky na Kolumbijské univerzitě v New Yorku. "Můžete změnit číslo své kreditní karty, pokud bude veřejné, ale nemůžete změnit svůj genom."

Citlivá data

Obavy o soukromí v genetických souborech dat byly vzneseny již dříve, ale zaměřovaly se především na „hromadná data“ genetických profilů. Ty obsahují informace o genové aktivitě zprůměrované napříč velkou buněčnou populací spíše než jednotlivými buňkami.

Dříve se předpokládalo, že jednobuněčné datové soubory nebudou tak zranitelné vůči narušení dat kvůli úrovni „šumu“ nebo variacím v genové expresi mezi různými buňkami. Gürsoy a její tým ale dokázali, že tomu tak není.

Tým zkoumal tři veřejně dostupné soubory jednobuněčných dat, které zahrnovaly krevní buňky od lidí s lupusem, chronickým autoimunitním onemocněním. Vědci zjistili, že mohou použít data genové exprese k předpovědi struktury genomu člověka kombinací těchto hodnot s informacemi o expresních kvantitativních lokusech (eQTL). Podrobnosti o eQTL – variacích v chromozomu, které korelují s genovou expresí – jsou také veřejně dostupné v jednobuněčných datasetech.

Aby vědci otestovali spolehlivost své práce, ověřili své předpovědi genomu oproti databázi genomu, která odpovídala použitým buňkám. Byli schopni propojit většinu datových souborů s odpovídajícím genomem s přesností přes 80 %.

Na rozdíl od dat genové exprese a eQTL mohou úplné databáze genomu obvykle prohlížet pouze vědci, aby chránili identifikační informace dárců. Vědci však poznamenávají, že genomická data účastníka by mohla být veřejně dostupná jinde. Mohli je například nahrát na genealogický web, kam uživatelé zasílají vzorky DNA, aby se dozvěděli více o svém původu. V tomto případě by útočník mohl identifikovat osobu, jejíž buňky jsou v jednobuněčném datovém souboru, pomocí analýzy jejich genomu. To by mohlo odhalit osobní údaje spojené s citlivou charakteristikou, jako je psychiatrická porucha, protože účastníci výzkumu jsou často vybíráni ke studiu biologie těchto složitých stavů.

Porušení dat, jako je toto, může mít skutečné důsledky, jako je diskriminace na pracovišti, říká Gürsoy. Dodává, že úniky by mohly mít dopad i na budoucí generace, protože genetické vlastnosti mohou být předány potomkům. „Vše, co se o nás ví, se předává z generace na generaci,“ říká.

Bradley Malin, který zkoumá rozsáhlé sdílení genomických dat na Vanderbiltově univerzitě v Nashvillu, Tennessee, popisuje studii jako „nový doplněk a příspěvek do literatury“. Dodává, že budoucí výzkum by mohl prozkoumat, zda by genomická data mohla být také propojena ve větších souborech dat obsahujících vzorky od tisíců nebo milionů lidí.

soutěžní zájmy

Vědci si nejsou jisti, jak nejlépe řešit obavy o soukromí. "Existuje touha chránit soukromí jednotlivce, ale také touha pokročit v lékařském výzkumu kolektivně, a to jsou bohužel ve vzájemném rozporu," říká Mark Gerstein, který se zabývá výzkumem lékařských dat na Yale University v New Haven, Connecticut. Nejjednodušším řešením by bylo ztížit přístup ke genetickým datům, ale to by mělo negativní dopad na výzkum, říká. „Potřebujeme sdílet a shromažďovat velké množství informací,“ vysvětluje. "Pokud vše zablokujeme a uděláme to soukromější, opravdu to celý proces brzdí."

Gürsoy a její kolegové ve své studii vyzývají k větší transparentnosti ohledně rizik pro účastníky, kteří sdílejí svá genomická data, a navrhují, aby výzkumníci zajistili souhlas dárců se sdílením jejich dat. Další možnou cestou by mohlo být šifrování osobních údajů, pokud jsou součástí veřejné databáze. Autoři uznávají, že by to zkomplikovalo proces vytváření a udržování záznamů, ale věří, že by to mohlo pomoci chránit soukromí účastníků.

  1. Walker, C. R. a kol. Buňka https://doi.org/10.1016/j.cell.2024.09.012 (2024).

    Článek
    Google Scholar

Stáhněte si reference