Jautrumas anoniminėms genų duomenų bazėms, skirtoms duomenų apsaugos pažeidimams

Naujas tyrimas rodo, kad anoniminės genetinės duomenų bazės yra jautrios tapatybės vagystėms ir duomenų apsaugos pažeidimams. Tyrėjai perspėja apie pasekmes.
(Symbolbild/natur.wiki)

Jautrumas anoniminėms genų duomenų bazėms, skirtoms duomenų apsaugos pažeidimams

Tyrimas sukėlė susirūpinimą, kad tam tikra genetinė duomenų bazė, kuri vis labiau populiaria tarp tyrėjų, galėtų būti panaudota siekiant atskleisti dalyvių tapatumą arba susieti privačią informaciją apie sveikatą su jų viešaisiais genetiniais profiliais.

Individualaus ląstelių duomenų rinkiniai ląstelių, surinktų tūkstančiai žmonių. Šie duomenys dažnai yra laisvai prieinami ir siūlo vertingą šaltinį tyrėjams, tiriantiems ligų poveikį ląstelių lygiu. Duomenys turėtų būti anonimizuoti, tačiau spalio 2 d. Žurnalo langelyje paskelbtas tyrimas 1 Norėdami atskleisti asmeninę informaciją apie asmenis kitame tyrime “, parašykite autorius.

Rezultatai pabrėžia sunkumus suderinti tyrėjų interesus su donorų privatumu. "Mūsų genomai yra labai identifikuojantys. Galite daug pasakyti apie mus, mūsų ypatybes ir ligos saugiklius",-sako tyrimo bendraautorius, Niujorko Kolumbijos universiteto Bioinformatikos tyrėjas Gamze Gürsoy. "Galite pakeisti savo kreditinės kortelės numerį, jei jis yra viešas, tačiau negalite pakeisti savo genomo."

neskelbtini duomenys

Apsvarstykite privačių duomenų įrašus . Juose yra informacijos apie genetinį aktyvumą, kuris yra vidutinis didelių ląstelių populiacijoje, o ne apie atskiras ląsteles.

Anksčiau buvo manoma, kad pavienių ląstelių duomenų rinkiniai nėra tokie jautrūs duomenų apsaugos pažeidimams dėl skirtingų ląstelių „triukšmo“ ar genų ekspresijos pokyčių. Tačiau Gürsoy ir jos komanda sugebėjo įrodyti, kad taip nėra.

Komanda ištyrė tris viešai prieinamus vieno ląstelių duomenų rinkinius, kuriuose buvo kraujo ląstelės iš žmonių, sergančių vilklige, lėtine automobilio liga. Tyrėjai nustatė, kad jie galėjo naudoti duomenis genų ekspresijai, kad numatytų asmens genomo struktūrą, derindami šias vertes su informacija apie ekspresijos kiekybinius bruožų lokusus (EQTL). Išsami informacija apie EQTLS variacijas chromosomoje, kurios koreliuoja su genų ekspresija-taip pat viešai prieinama atskirų ląstelių duomenų rinkiniuose.

Siekdami patikrinti savo darbo patikimumą, tyrėjai patikrino savo genomo prognozes, remdamasis genomo duomenų baze, atitinkančia naudotas ląsteles. Jie sugebėjo susieti daugumą duomenų įrašų su atitinkamu genomu, kurio tikslumas buvo didesnis nei 80 %.

Priešingai nei duomenys apie genų ekspresiją ir EQTL, išsamias genomo duomenų bazes paprastai gali peržiūrėti tik mokslininkai, kad apsaugotų identifikuojančią informaciją nuo donorų. Tačiau tyrėjai pabrėžia, kad dalyvio genomo duomenys gali būti viešai prieinami kažkur kitur. Pavyzdžiui, jūs galėjote juos įkelti į genealogijos svetainę, kurioje vartotojai siunčia DNR pavyzdžius, kad sužinotų daugiau apie jų nusileidimą. Tokiu atveju užpuolikas galėtų nustatyti asmenį, kurio ląstelės yra vienos ląstelės duomenų rinkinyje, analizuodamas jų genomą. Tai galėtų atskleisti asmens duomenis, susijusius su jautriu bruožu, pavyzdžiui, psichiatriniu sutrikimu, nes tyrimų dalyviai dažnai pasirenkami tiriant šių sudėtingų sąlygų biologiją.

Duomenų apsaugos traumos, tokios kaip šis, gali turėti realių padarinių, tokių kaip diskriminacija darbo vietoje, sako Gürsoy. Tai priduria, kad nutekėjimai netgi gali turėti įtakos ateities kartoms, nes palikuonims galima perduoti genetines savybes. „Viskas, kas apie mus žinoma, vykdo kartos“, - sako ji.

Bradley Malin, kuris didelio masto genomo duomenų mainų srityje Vanderbilto universitete Nešvilyje, Tenesis, tyrimai apibūdina tyrimą kaip „naują pratęsimą ir indėlį į literatūrą“. Jis priduria, kad būsimi tyrimai galėtų ištirti, ar genomo duomenys taip pat gali būti susieti didesniuose duomenų įrašuose, kuriuose yra tūkstančių ar milijonų žmonių pavyzdžiai.

Konkurencijos interesai

Mokslininkai nėra tikri, kaip geriausia spręsti duomenų apsaugos problemas. „Yra noras apsaugoti ne tik asmens privatumą, bet ir norą kartu skatinti medicininius tyrimus, ir, deja, prieštarauja vienas kitam“, - sako Markas Gersteinas, tyrinėjantis Jeilio universitetą Naujajame Havene, Konektikute, Medice duomenys. Jis sako, kad paprasčiausias sprendimas būtų apsunkinti genetinius duomenis, tačiau tai neigiamai paveiktų tyrimus. „Mes turime pasidalyti ir surinkti didelius kiekius informacijos“, - aiškina jis. "Jei mes viską užblokuosime ir padarysime privačiu, tai tikrai trukdo visam procesui."

Savo tyrime Gürsoy ir jos kolegos reikalauja didesnio skaidrumo dėl rizikos dalyviams, kurie dalijasi savo genomo duomenimis, ir siūlo tyrėjams užtikrinti, kad donorai sutiktų perduoti savo duomenis. Kitas galimas būdas gali būti asmens duomenų šifravimas, jei esate viešosios duomenų bazės dalis. Autoriai pripažįsta, kad tai apsunkins duomenų įrašų kūrimo ir laukimo procesą, tačiau manoma, kad tai galėtų padėti apsaugoti dalyvių privatumą.

  1. >

    Walker, C. R. ir kt. Ląstelė https://doi.org/10.1016/j.cell.2024.09.012 (2024).