Känslighet för anonyma gendatabaser för överträdelser av dataskydd

En ny studie visar att anonyma genetiska databaser är mottagliga för överträdelser av identitetsstöld och överträdelser av dataskydd. Forskare varnar för konsekvenserna.
(Symbolbild/natur.wiki)

Känslighet för anonyma gendatabaser för överträdelser av dataskydd

En studie har utlöst oro över att en slags genetisk databas som blir alltmer populär bland forskare kan utnyttjas för att avslöja deltagarnas identitet eller för att koppla privat hälsoinformation till sina offentliga genetiska profiler.

1 För att avslöja privat information om individer i en annan studie, "Skriv författarna.

Resultaten betonar svårigheten att förena forskarnas intressen med givarnas integritet. "Våra genom är mycket identifierande. Du kan säga mycket om oss, våra egenskaper och våra sjukdomar av sjukdom", säger medförfattaren till studien, Gamze Gürsoy, bioinformatikforskare vid Columbia University i New York City. "Du kan ändra ditt kreditkortsnummer om det är offentligt, men du kan inte ändra ditt genom."

känslig data

överväga de privata i genetiska data men har redan varit uttryckta, men har redan varit uttryckta, men huvudfokuserade "massa data" genic genetic. Dessa innehåller information om genetisk aktivitet som är genomsnittlig över en stor cellpopulation och inte om enskilda celler.

Tidigare trodde man att enstaka celldatauppsättningar inte var så mottagliga för överträdelser av dataskydd på grund av nivån av "brus", eller variation i genuttryck, mellan de olika cellerna. Men Gürsoy och hennes team kunde bevisa att detta inte är fallet.

Teamet undersökte tre offentligt tillgängliga enskilda celldatauppsättningar, som innehöll blodceller från personer med lupus, kronisk bilsjukdom. Forskarna fann att de kunde använda data för genuttryck för att förutsäga strukturen för genomet av en person genom att kombinera dessa värden med information om uttryckskvantitativa egenskaper (EQTL). Detaljerna för EQTLS-variationerna i kromosom, som korrelerar med genuttryck-är också offentligt tillgängliga i enstaka celldatauppsättningar.

För att testa tillförlitligheten i deras arbete kontrollerade forskarna sina genomprognoser baserade på en genomdatabas som motsvarade de celler som använts. De kunde länka de flesta dataposter med motsvarande genom, med en noggrannhetsgrad på över 80 %.

I motsats till data om genuttryck och eQTL kan kompletta genomdatabaser vanligtvis endast ses av forskare för att skydda identifierande information från givarna. Forskarna påpekar emellertid att genomdata från en deltagare skulle kunna vara allmänt tillgängliga någon annanstans. Till exempel kan du ha laddat upp dem på en släktforskningswebbplats där användare skickar DNA -prover för att lära dig mer om deras härkomst. I det här fallet kunde en angripare identifiera en person vars celler befinner sig i en enda celldata genom att analysera deras genom. Detta kan avslöja personuppgifter som är relaterade till en känslig egenskap som en psykiatrisk störning, eftersom forskningsdeltagare ofta väljs för att undersöka biologin för dessa komplexa tillstånd.

Skyddsskador som denna kan få verkliga konsekvenser, till exempel diskriminering på arbetsplatsen, säger Gürsoy. Den tillägger att läckor till och med kan påverka kommande generationer, eftersom genetiska egenskaper kan överföras till ättlingar. "Allt som blir känt om oss bedrivs av generationer," säger hon.

Bradley Malin, som inom området med storskalig genomdatautbyte vid Vanderbilt University i Nashville, Tennessee, undersöker, beskriver studien som en "ny förlängning och bidrag till litteratur". Han tillägger att framtida forskning kan undersöka om genomdata också kan kopplas i större dataposter som innehåller prover av tusentals eller miljoner människor.

Konkurrensintressen

Forskare är osäkra på hur man bäst hanterar problem med dataskydd. "Det finns en önskan att skydda individens integritet, men också önskan att främja medicinsk forskning kollektivt, och dessa är tyvärr i motsats till varandra," säger Mark Gerstein, som forskar vid Yale University i New Haven, Connecticut, Medic Data. Den enklaste lösningen skulle vara att göra tillgång till genetiska data svårare, men det skulle påverka forskningen negativt, säger han. "Vi måste dela och samla stora mängder information," förklarar han. "Om vi ​​blockerar allt och gör det mer privat, hindrar det verkligen hela processen."

I sin studie kräver Gürsoy och hennes kollegor större öppenhet om riskerna för deltagare som delar sina genomdata och föreslår att forskare bör se till att givarna går med på att vidarebefordra sina uppgifter. Ett annat möjligt sätt kan vara kryptering av personuppgifter om du är en del av en offentlig databas. Författarna inser att detta skulle komplicera processen att skapa och vänta dataposter, men det anser att det kan hjälpa till att skydda deltagarnas integritet.

  1. Walker, C. R. et al. Cell https://doi.org/10.1016/j.cell.2024.09.012 (2024).

    Artikel