Vulnerabilidad de las bases de datos genéticas anónimas a las violaciones de datos

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Un nuevo estudio muestra que las bases de datos genéticas anónimas son vulnerables al robo de identidad y a la violación de datos. Los investigadores advierten de las consecuencias.

Eine neue Studie zeigt, dass anonyme genetische Datenbanken anfällig sind für Identitätsdiebstahl und Datenschutzverletzungen. Forschende warnen vor den Folgen.
Un nuevo estudio muestra que las bases de datos genéticas anónimas son vulnerables al robo de identidad y a la violación de datos. Los investigadores advierten de las consecuencias.

Vulnerabilidad de las bases de datos genéticas anónimas a las violaciones de datos

Un estudio ha generado preocupación de que un tipo de base de datos genética cada vez más popular entre los investigadores pueda ser explotada para revelar las identidades de los participantes o vincular información de salud privada con sus perfiles genéticos públicos.

Conjuntos de datos de una sola celda puede contener información sobre la expresión genética en millones de células recolectadas de miles de personas. Estos datos suelen estar disponibles gratuitamente y proporcionan un recurso valioso para los investigadores que estudian los efectos de las enfermedades a nivel celular. Se dice que los datos son anónimos, pero un estudio publicado el 2 de octubre en la revista Cell 1 muestra cómo los datos genéticos de un estudio "pueden explotarse para descubrir información privada sobre individuos en otro estudio", escriben los autores.

Los resultados resaltan la dificultad de equilibrar los intereses de los investigadores con la privacidad de los donantes. "Nuestros genomas son muy identificativos. Pueden decir mucho sobre nosotros, nuestras características y nuestra susceptibilidad a las enfermedades", dice el coautor del estudio Gamze Gürsoy, investigador de bioinformática de la Universidad de Columbia en la ciudad de Nueva York. "Puedes cambiar tu número de tarjeta de crédito si se hace público, pero no puedes cambiar tu genoma".

Datos sensibles

Preocupaciones de privacidad en conjuntos de datos genéticos Se han planteado antes, pero se han centrado principalmente en "datos masivos" de perfiles genéticos. Estos contienen información sobre la actividad genética promediada en una gran población de células en lugar de células individuales.

Anteriormente se pensaba que los conjuntos de datos unicelulares no serían tan vulnerables a las filtraciones de datos debido al nivel de "ruido" o variación en la expresión genética entre diferentes células. Pero Gürsoy y su equipo pudieron demostrar que no es así.

El equipo examinó tres conjuntos de datos unicelulares disponibles públicamente que incluían células sanguíneas de personas con lupus, una enfermedad autoinmune crónica. Los investigadores descubrieron que podían utilizar datos de expresión genética para predecir la estructura del genoma de una persona combinando estos valores con información sobre los loci de rasgos cuantitativos de expresión (eQTL). Los detalles de los eQTL (variaciones en el cromosoma que se correlacionan con la expresión genética) también están disponibles públicamente en conjuntos de datos unicelulares.

Para probar la confiabilidad de su trabajo, los investigadores compararon sus predicciones genómicas con una base de datos genómica que correspondía a las células utilizadas. Pudieron vincular la mayoría de los conjuntos de datos con el genoma correspondiente, con una tasa de precisión superior al 80%.

A diferencia de los datos de expresión genética y los eQTL, las bases de datos del genoma completo normalmente solo pueden ser vistas por científicos para proteger la información de identificación de los donantes. Sin embargo, los investigadores señalan que los datos genómicos de un participante podrían estar disponibles públicamente en otros lugares. Por ejemplo, es posible que los hayan subido a un sitio web de genealogía donde los usuarios envían muestras de ADN para aprender más sobre su ascendencia. En este caso, un atacante podría identificar a una persona cuyas células se encuentran en un conjunto de datos unicelular analizando su genoma. Esto podría revelar datos personales asociados con una característica sensible como un trastorno psiquiátrico, ya que los participantes de la investigación a menudo son seleccionados para estudiar la biología de estas condiciones complejas.

Este tipo de filtraciones de datos podrían tener consecuencias reales, como la discriminación en el lugar de trabajo, afirma Gürsoy. Añade que las filtraciones podrían incluso afectar a las generaciones futuras porque los rasgos genéticos pueden transmitirse a la descendencia. "Todo lo que se sabe sobre nosotros se transmite de generación en generación", afirma.

Bradley Malin, que investiga el intercambio de datos genómicos a gran escala en la Universidad de Vanderbilt en Nashville, Tennessee, describe el estudio como una "nueva adición y contribución a la literatura". Añade que investigaciones futuras podrían explorar si los datos genómicos también podrían vincularse en conjuntos de datos más grandes que contengan muestras de miles o millones de personas.

intereses de competencia

Los científicos no están seguros de cuál es la mejor manera de abordar las preocupaciones sobre la privacidad. "Existe el deseo de proteger la privacidad individual, pero también el deseo de hacer avanzar la investigación médica de manera colectiva, y desafortunadamente ambos están en desacuerdo entre sí", dice Mark Gerstein, quien investiga ciencia de datos médicos en la Universidad de Yale en New Haven, Connecticut. La solución más sencilla sería dificultar el acceso a los datos genéticos, pero eso afectaría negativamente a la investigación, afirma. "Necesitamos compartir y agregar grandes cantidades de información", explica. "Si bloqueamos todo y lo hacemos más privado, realmente obstaculiza todo el proceso".

En su estudio, Gürsoy y sus colegas piden una mayor transparencia sobre los riesgos para los participantes que comparten sus datos genómicos y sugieren que los investigadores se aseguren de que los donantes den su consentimiento para compartir sus datos. Otra posible ruta podría ser cifrar los datos personales si forman parte de una base de datos pública. Los autores reconocen que esto complicaría el proceso de creación y mantenimiento de registros, pero creen que podría ayudar a proteger la privacidad de los participantes.

  1. Walker, CR y col. Celular https://doi.org/10.1016/j.cell.2024.09.012 (2024).

    Artículo
    Google Académico

Descargar referencias