对违反数据保护的匿名基因数据库的敏感性

一项新的研究表明,匿名遗传数据库容易受到身份盗用和违反数据保护的影响。研究人员警告后果。
(Symbolbild/natur.wiki)

对违反数据保护的匿名基因数据库的敏感性

一项研究引发了人们的担忧,即可以利用一种越来越多的研究人员流行的遗传数据库来披露参与者的身份或将私人健康信息与公共遗传特征联系起来。

1 1 )以另一个研究中的私人信息,请写下授课者。

结果强调了将研究人员的利益与捐助者的隐私相结合的困难。纽约市哥伦比亚大学生物信息学研究人员GamzeGürsoy的合着者GamzeGürsoy说:“我们的基因组非常确定。 “如果是公开的,您可以更改信用卡号,但您不能更改基因组。”

敏感数据

Consider the privacy in Genetic Data records have already been expressed, but mainly focused on "mass data" genetic profiles.这些包含有关遗传活性的信息,这些信息是在大细胞群中平均而不是单个细胞的信息。

过去,人们认为,由于“噪声”的水平或基因表达的变化,单个细胞数据集并不容易受到数据保护的影响。但是Gürsoy和她的团队能够证明情况并非如此。

小组检查了三个公开可用的单细胞数据集,其中包含来自狼疮患者,慢性汽车疾病的血细胞。研究人员发现,他们能够通过将这些值与有关表达定量性状基因座(EQTLS)相结合的信息来使用基因表达的数据来预测人的基因组结构。染色体中EQTLS变化的细节,与基因表达相关 - 在单细胞数据集中也可以公开访问。

为了测试其工作的可靠性,研究人员根据与所使用的细胞相对应的基因组数据库检查了基因组预测。他们能够将大多数数据记录与相应的基因组联系起来,准确率超过80%。

与基因表达和EQTL的数据相反,通常只能由科学家查看完整的基因组数据库,以保护识别信息免受捐助者的影响。但是,研究人员指出,参与者的基因组数据可以在其他地方公开获得。例如,您可能已经将它们上传到了家谱网站上,用户将DNA样品发送到更多有关其下降的信息。在这种情况下,攻击者可以通过分析其基因组来识别单个细胞数据中细胞的人。这可能会发现与敏感特征(例如精神疾病)相关的个人数据,因为经常选择研究参与者来检查这些复杂疾病的生物学。

Gürsoy说,

这样的数据保护伤害可能会带来真正的后果,例如在工作场所的歧视。它补充说,泄漏甚至可能会对子孙后代产生影响,因为遗传特征可以传递给后代。她说:“关于我们的一切知识都是世代相传的。”

布拉德利·马林(Bradley Malin)在田纳西州纳什维尔的大规模基因组数据交流领域,他将这项研究描述为“新的扩展和对文学的贡献”。他补充说,未来的研究可以调查是否还可以在包含数千或数百万人样本的较大数据记录中链接基因组数据。

竞争兴趣

科学家不确定如何最好地解决数据保护问题。马克·格斯坦(Mark Gerstein)说:“有一种保护个人隐私的愿望,但也渴望集体促进医学研究,不幸的是,彼此之间是矛盾的。”他说,最简单的解决方案是使对遗传数据的访问更加困难,但这会对研究产生负面影响。他解释说:“我们必须共享和汇总大量信息。” “如果我们阻止一切并使其更加私密,它确实会阻碍整个过程。”

在他们的研究中,Gürsoy和她的同事要求对共享基因组数据的参与者的风险提高透明度,并建议研究人员应确保捐助者同意传递其数据。如果您是公共数据库的一部分,则可能是对个人数据的加密。作者认识到,这将使创建和等待数据记录的过程变得复杂,但它认为它可以帮助保护参与者的隐私。

  1. Walker,C。R.等。单元https://doi.org/10.1016/j.cell.2024.09.012(2024)。