Suscettibilità ai database genici anonimi per violazioni della protezione dei dati

Un nuovo studio mostra che i database genetici anonimi sono suscettibili alle violazioni del furto di identità e della protezione dei dati. I ricercatori avvertono delle conseguenze.
(Symbolbild/natur.wiki)

Suscettibilità ai database genici anonimi per violazioni della protezione dei dati

Uno studio ha innescato preoccupazione per il fatto che una sorta di database genetico che è sempre più popolare tra i ricercatori potrebbe essere sfruttata per divulgare l'identità dei partecipanti o per collegare le informazioni sulla salute privata con i loro profili genetici pubblici.

; di cellule raccolte da migliaia di persone. Questi dati sono spesso liberamente accessibili e offrono una risorsa preziosa per i ricercatori che esaminano gli effetti delle malattie a livello cellulare. I dati dovrebbero essere anonimi, ma uno studio pubblicato il 2 ottobre nella cella della rivista 1 Per scoprire le informazioni private su un altro studio ", scrivi gli autori.

I risultati sottolineano la difficoltà di riconciliare gli interessi dei ricercatori con la privacy dei donatori. "I nostri genomi si stanno identificando molto. Puoi dire molto su di noi, le nostre caratteristiche e le nostre fusibili di malattia", afferma il coautore dello studio, Gamze Gürsoy, ricercatore di bioinformatica presso la Columbia University di New York City. "Puoi cambiare il numero della tua carta di credito se è pubblico, ma non puoi cambiare il tuo genoma."

Dati sensibili

Consider the privacy in Genetic Data records have already been expressed, but mainly focused on "mass data" genetic profiles. Questi contengono informazioni sull'attività genetica che sono in media su una grande popolazione cellulare e non sulle singole cellule.

In passato, si pensava che i set di dati a cellula singola non fossero così suscettibili alle violazioni della protezione dei dati, a causa del livello di "rumore" o della variazione dell'espressione genica, tra le diverse cellule. Ma Gürsoy e la sua squadra sono stati in grado di dimostrare che non è così.

Il team ha esaminato tre set di dati a singola cellula disponibili al pubblico, che contenevano cellule del sangue da persone con lupus, malattia da automobile cronica. I ricercatori hanno scoperto di essere in grado di utilizzare i dati per l'espressione genica per prevedere la struttura del genoma di una persona combinando questi valori con informazioni sui loci del tratto quantitativo dell'espressione (EQTLS). I dettagli delle variazioni EQTLS nel cromosoma, che sono correlate all'espressione genica, sono anche accessibili pubblicamente nei set di dati di singola cellula.

Al fine di testare l'affidabilità del loro lavoro, i ricercatori hanno verificato le loro previsioni del genoma in base a un database del genoma che corrispondeva alle cellule utilizzate. Sono stati in grado di collegare la maggior parte dei record di dati con il genoma corrispondente, con un tasso di precisione di oltre l'80 %.

Contrariamente ai dati sull'espressione genica e gli EQTL, i database completi del genoma possono di solito essere visualizzati solo dagli scienziati al fine di proteggere le informazioni identificative dai donatori. Tuttavia, i ricercatori sottolineano che i dati del genoma di un partecipante potrebbero essere disponibili pubblicamente altrove. Ad esempio, avresti potuto caricarli su un sito Web di genealogia su cui gli utenti inviano campioni di DNA per saperne di più sulla loro discesa. In questo caso, un utente malintenzionato potrebbe identificare una persona le cui cellule si trovano in un set di dati di singola cellula analizzando il loro genoma. Ciò potrebbe scoprire dati personali correlati a una caratteristica sensibile come un disturbo psichiatrico, poiché i partecipanti alla ricerca sono spesso selezionati per esaminare la biologia di queste condizioni complesse.

Injurie di protezione dei dati come questa potrebbero avere conseguenze reali, come la discriminazione sul posto di lavoro, afferma Gürsoy. Aggiunge che le perdite potrebbero anche avere un impatto sulle generazioni future, poiché le caratteristiche genetiche possono essere trasmesse ai discendenti. "Tutto ciò che si sa di noi è portato avanti da generazioni", afferma.

Bradley Malin, che nell'area dello scambio di dati del genoma su larga scala presso la Vanderbilt University di Nashville, nel Tennessee, Descrive lo studio come una "nuova estensione e contributo alla letteratura". Aggiunge che la ricerca futura potrebbe indagare se i dati del genoma potrebbero anche essere collegati in record di dati più grandi che contengono campioni di migliaia o milioni di persone.

Interessi della concorrenza

Gli scienziati non sono sicuri del modo migliore per affrontare i problemi di protezione dei dati. "C'è il desiderio di proteggere la privacy dell'individuo, ma anche il desiderio di promuovere la ricerca medica collettivamente, e questi sono purtroppo in contraddizione reciproca", afferma Mark Gerstein, che sta ricercando alla Yale University di New Haven, Connecticut, Medic. La soluzione più semplice sarebbe quella di rendere più difficile l'accesso ai dati genetici, ma ciò influenzerebbe negativamente la ricerca, afferma. "Dobbiamo condividere e aggregare grandi quantità di informazioni", spiega. "Se blocciamo tutto e lo rendiamo più privato, ostacola davvero l'intero processo."

Nel loro studio, Gürsoy e i suoi colleghi richiedono una maggiore trasparenza sui rischi per i partecipanti che condividono i loro dati del genoma e suggeriscono che i ricercatori dovrebbero garantire che i donatori accettano di trasmettere i loro dati. Un altro modo possibile potrebbe essere la crittografia dei dati personali se fai parte di un database pubblico. Gli autori riconoscono che ciò complicherebbe il processo di creazione e attesa dei record di dati, ma è dell'opinione che potrebbe aiutare a proteggere la privacy dei partecipanti.

    >
  1. Walker, C. R. et al. Cell https://doi.org/10.1016/j.cell.2024.09.012 (2024).

    articolo scaricati