Értelmezettség az anonim génadatbázisokra az adatvédelmi megsértések miatt

Egy új tanulmány azt mutatja, hogy az anonim genetikai adatbázisok hajlamosak a személyazonosság -lopásokra és az adatvédelmi megsértésre. A kutatók figyelmeztetik a következményeket.
(Symbolbild/natur.wiki)

Értelmezettség az anonim génadatbázisokra az adatvédelmi megsértések miatt

Egy tanulmány aggodalmát váltott ki, hogy egyfajta genetikai adatbázis, amely egyre népszerűbb a kutatók körében, kihasználható a résztvevők személyazonosságának nyilvánosságra hozatalára vagy a magán egészségügyi információk összekapcsolására a köztagi profiljukkal.

egyéni cella adatkészletekről. A több ezer ember által összegyűjtött cellák. Ezek az adatok gyakran szabadon hozzáférhetők, és értékes forrást kínálnak azoknak a kutatóknak, akik a betegségek hatásait a sejtszinten vizsgálják. Az adatokat anonimizálni kell, de egy október 2-án közzétett tanulmány a Az eredmények hangsúlyozzák a kutatók érdekeinek összeegyeztetésének nehézségét az adományozók magánéletével. "Genomjaink nagyon azonosítanak. Sokat mondhatsz rólunk, jellemzőinkről és a betegség fúzióinkról"-mondja a tanulmány társszerzője, Gamze Gürsoy, a New York-i Columbia Egyetem bioinformatikai kutatója. "Megváltoztathatja a hitelkártya számát, ha nyilvános, de nem változtathatja meg a genomját."

érzékeny adatok

Fontolja meg a genetikai adatrekordok részét. Ezek olyan információkat tartalmaznak a genetikai aktivitásról, amelyek átlagosak egy nagy sejtpopulációra, nem pedig az egyes sejtekre.

A múltban azt gondolták, hogy az egyes sejtek adatkészletei nem voltak annyira érzékenyek az adatvédelem megsértésére, a "zaj" szintje vagy a gén expressziójának eltérése miatt a különböző sejtek között. De Gürsoy és csapata bebizonyította, hogy nem ez a helyzet.

A csoport három nyilvánosan elérhető egysejtes adatkészletet vizsgált meg, amelyek lupus, krónikus autóbetegségben szenvedő emberek vérsejtjeit tartalmazták. A kutatók azt találták, hogy képesek voltak felhasználni az adatokat a gén expressziójára, hogy megjósolják egy személy genomjának szerkezetét azáltal, hogy ezeket az értékeket kombinálják az expressziós kvantitatív tulajdonságok lókuszaival (EQTLS). Az EQTLS variációk részletei a kromoszómában, amelyek korrelálnak a gén expressziójával-az egysejtek adatkészleteiben is nyilvánosan elérhetőek.

A munkájuk megbízhatóságának tesztelése érdekében a kutatók ellenőrizték a genom előrejelzéseiket egy genom adatbázis alapján, amely megfelel a használt sejteknek. Képesek voltak összekapcsolni a legtöbb adatrekordot a megfelelő genommal, a pontossági ráta pedig több mint 80 %.

A génexpresszióra és az EQTL -kkel kapcsolatos adatokkal ellentétben a teljes genom adatbázisokat a tudósok általában csak a donoroktól való azonosító információk védelme érdekében tekinthetik meg. A kutatók azonban rámutatnak, hogy a résztvevő genomadatainak nyilvánosan elérhetőek lehetnek valahol máshol. Például feltölthette volna őket egy genealógiai webhelyre, amelyen a felhasználók DNS -mintákat küldenek, hogy többet megtudhassanak a leszállásukról. Ebben az esetben a támadó azonosíthatott egy olyan személyt, akinek a sejtjei egyetlen sejtadatban vannak, a genom elemzésével. Ez feltárhatja a személyes adatokat, amelyek egy érzékeny tulajdonsághoz kapcsolódnak, például pszichiátriai rendellenességhez, mivel a kutatás résztvevőit gyakran választják ki ezen összetett állapotok biológiájának vizsgálatára.

Az ilyen adatvédelmi sérüléseknek valódi következményei lehetnek, például a munkahelyi megkülönböztetés - mondja Gürsoy. Hozzáteszi, hogy a szivárgások akár hatással lehetnek a jövő generációira, mivel a genetikai tulajdonságok átadhatók az leszármazottaknak. "Mindent, amit rólunk tudnak, generációk folytatják" - mondja.

Bradley Malin, aki a Tennessee-i Nashville-i Vanderbilt Egyetemen a nagyszabású genomadat-csere területén a kutatást "új kiterjesztésnek és az irodalomhoz való hozzájárulásnak" írja le. Hozzáteszi, hogy a jövőbeli kutatások megvizsgálhatják, hogy a genomadatokat nagyobb adatrekordokban is összekapcsolhatják -e, amelyek több ezer vagy millió millió mintát tartalmaznak.

A verseny érdekei

A tudósok nem tudják, hogyan lehet a legjobban kezelni az adatvédelmi aggályokat. "A vágy az egyén magánéletének védelme, hanem az orvosi kutatások együttes előmozdításának vágya is, és ezek sajnos ellentmondásban vannak egymással" - mondja Mark Gerstein, aki a Connecticuti New Haven -i Yale Egyetemen kutatja. A legegyszerűbb megoldás az lenne, ha megnehezítené a genetikai adatokhoz való hozzáférést, de ez negatívan befolyásolja a kutatást - mondja. "Nagy mennyiségű információt kell megosztanunk és összesíteni kell" - magyarázza. "Ha mindent blokkolunk, és privátabbá teszünk, akkor ez valóban akadályozza az egész folyamatot."

Tanulmányukban Gürsoy és kollégái nagyobb átláthatóságot igényelnek a genom adataikat megosztó résztvevők kockázatainál, és azt sugallják, hogy a kutatók gondoskodnak arról, hogy a donorok elfogadják az adataikat. Egy másik lehetséges módszer lehet a személyes adatok titkosítása, ha egy nyilvános adatbázis része. A szerzők felismerik, hogy ez bonyolítja az adatrekordok létrehozásának és várakozási folyamatát, de véleménye szerint ez segíthet a résztvevők magánéletének védelmében.

  1. Walker, C. R. et al. Cell https://doi.org/10.1016/j.cell.2024.09.012 (2024).

  2. Letöltés referenciák