Susceptibilidade a bancos de dados de genes anônimos para violações de proteção de dados

Susceptibilidade a bancos de dados de genes anônimos para violações de proteção de dados
Um estudo desencadeou preocupações de que um tipo de banco de dados genético que seja cada vez mais popular entre os pesquisadores possa ser explorado para divulgar a identidade dos participantes ou vincular informações privadas à saúde a seus perfis genéticos públicos.
1 Para descobrir informações privadas sobre outro estudo ", escreva os autores.
Os resultados enfatizam a dificuldade de conciliar os interesses dos pesquisadores com a privacidade dos doadores. "Nossos genomas são muito identificados. Você pode dizer muito sobre nós, nossas características e nossos fusíveis de doença", diz o co-autor do estudo, Gamze Gürsoy, pesquisador de bioinformática da Universidade de Columbia, em Nova York. "Você pode alterar o número do seu cartão de crédito se for público, mas não pode mudar seu genoma".
Dados sensíveis
No passado, pensava -se que os conjuntos de dados de células únicos não eram tão suscetíveis a violações de proteção de dados, devido ao nível de "ruído" ou variação na expressão gênica entre as diferentes células. Mas Gürsoy e sua equipe conseguiram provar que esse não é o caso.
A equipe examinou três conjuntos de dados de células únicas disponíveis publicamente, que continham células sanguíneas de pessoas com lúpus, doença de carros crônicos. Os pesquisadores descobriram que foram capazes de usar os dados da expressão gênica para prever a estrutura do genoma de uma pessoa, combinando esses valores com informações sobre loci de características quantitativas de expressão (EQTLs). Os detalhes das variações de EQTLs no cromossomo, que se correlacionam com a expressão gênica-também são acessíveis publicamente em conjuntos de dados de células únicas.
Para testar a confiabilidade de seu trabalho, os pesquisadores verificaram suas previsões de genoma com base em um banco de dados do genoma que correspondia às células utilizadas. Eles foram capazes de vincular a maioria dos registros de dados ao genoma correspondente, com uma taxa de precisão superior a 80 %.
Em contraste com os dados sobre expressão gênica e EQTLs, os bancos de dados completos do genoma geralmente podem ser vistos apenas pelos cientistas para proteger as informações de identificação dos doadores. No entanto, os pesquisadores apontam que os dados do genoma de um participante podem estar disponíveis ao público em outro lugar. Por exemplo, você poderia tê -los enviado em um site de genealogia no qual os usuários enviam amostras de DNA para aprender mais sobre sua descida. Nesse caso, um invasor pode identificar uma pessoa cujas células estão em um único conjunto de dados de células analisando seu genoma. Isso pode descobrir dados pessoais relacionados a um recurso sensível, como um distúrbio psiquiátrico, uma vez que os participantes da pesquisa são frequentemente selecionados para examinar a biologia dessas condições complexas.Lesões por proteção de dados como essa podem ter consequências reais, como discriminação no local de trabalho, diz Gürsoy. Ele acrescenta que os vazamentos podem até ter um impacto nas gerações futuras, pois as características genéticas podem ser transmitidas aos descendentes. "Tudo o que se sabe sobre nós é realizado por gerações", diz ela.
Bradley Malin, que na área de troca de dados de genoma em larga escala da Universidade Vanderbilt, em Nashville, Tennessee, pesquisa, descreve o estudo como uma "nova extensão e contribuição para a literatura". Ele acrescenta que pesquisas futuras podem investigar se os dados do genoma também podem ser vinculados a registros de dados maiores que contêm amostras de milhares ou milhões de pessoas.
interesses de concorrência
Os cientistas não têm certeza da melhor forma de enfrentar as preocupações de proteção de dados. "Há um desejo de proteger a privacidade do indivíduo, mas também o desejo de promover a pesquisa médica coletivamente, e infelizmente estão em contradição", diz Mark Gerstein, que está pesquisando na Universidade de Yale em New Haven, Connecticut, Medic Data. A solução mais simples seria dificultar o acesso a dados genéticos, mas isso influenciaria negativamente a pesquisa, diz ele. "Temos que compartilhar e agregar grandes quantidades de informações", explica ele. "Se bloquearmos tudo e torná -lo mais privado, isso realmente dificulta todo o processo".
Em seu estudo, Gürsoy e seus colegas exigem maior transparência sobre os riscos para os participantes que compartilham seus dados do genoma e sugerem que os pesquisadores devem garantir que os doadores concordem em transmitir seus dados. Outra maneira possível pode ser a criptografia de dados pessoais se você fizer parte de um banco de dados público. Os autores reconhecem que isso complicaria o processo de criação e espera registros de dados, mas é da opinião de que poderia ajudar a proteger a privacidade dos participantes.
- >
- >>
Walker, C. R. et al. Cell https://doi.org/10.1016/j.cell.2024.09.012 (2024).