Sensibilitatea la bazele de date de gene anonime pentru încălcări ale protecției datelor

Sensibilitatea la bazele de date de gene anonime pentru încălcări ale protecției datelor
Un studiu a declanșat îngrijorări că un fel de bază de date genetică care este din ce în ce mai populară în rândul cercetătorilor ar putea fi exploatată pentru a dezvălui identitatea participanților sau pentru a lega informațiile private de sănătate cu profilurile genetice publice.
Seturi de date de celule individuale celulele colectate de mii de oameni. Aceste date sunt adesea accesibile liber și oferă o resursă valoroasă pentru cercetătorii care examinează efectele bolilor la nivel celular. Datele ar trebui să fie anonimizate, dar un studiu publicat pe 2 octombrie în celula revistei 1 Pentru a descoperi informațiile private despre persoane din alt studiu ", scrieți autorii.
Rezultatele subliniază dificultatea de a reconcilia interesele cercetătorilor cu confidențialitatea donatorilor. "Genomii noștri sunt foarte identificați. Puteți spune multe despre noi, caracteristicile noastre și siguranțele noastre de boală", spune coautorul studiului, Gamze Gürsoy, cercetător bioinformatic la Universitatea Columbia din New York. "Puteți schimba numărul cardului de credit dacă este public, dar nu vă puteți schimba genomul."
date sensibile
În trecut, s -a crezut că seturile de date cu celule unice nu erau atât de sensibile la încălcările de protecție a datelor, din cauza nivelului de „zgomot” sau a variației expresiei genice între diferite celule. Dar Gürsoy și echipa ei au reușit să demonstreze că nu este cazul.
Echipa a examinat trei seturi de date cu celule unice disponibile public, care conțineau celule sanguine de la persoane cu lupus, boală cronică auto. Cercetătorii au descoperit că au putut folosi datele pentru expresia genelor pentru a prezice structura genomului unei persoane prin combinarea acestor valori cu informații despre loci de trăsături cantitative de expresie (eqtls). Detaliile variațiilor EQTLS în cromozom, care se corelează cu expresia genelor-sunt, de asemenea, accesibile public în seturi de date cu celule unice.
Pentru a testa fiabilitatea muncii lor, cercetătorii și -au verificat prognozele genomului pe baza unei baze de date genomice care corespunde celulelor utilizate. Aceștia au putut lega majoritatea înregistrărilor de date cu genomul corespunzător, cu o rată de precizie de peste 80 %.
Spre deosebire de datele privind expresia genelor și EQTLS, bazele de date ale genomului complet pot fi de obicei vizualizate doar de oamenii de știință pentru a proteja informațiile de identificare de donatori. Cu toate acestea, cercetătorii subliniază că datele genomului unui participant ar putea fi disponibile public în altă parte. De exemplu, le -ai fi putut încărca pe un site web de genealogie pe care utilizatorii trimit probe ADN pentru a afla mai multe despre coborârea lor. În acest caz, un atacator ar putea identifica o persoană ale cărei celule se află într -o singură set de date celulare, analizând genomul lor. Acest lucru ar putea descoperi date cu caracter personal care sunt legate de o caracteristică sensibilă, cum ar fi o tulburare psihiatrică, deoarece participanții la cercetare sunt adesea selectați pentru a examina biologia acestor afecțiuni complexe.Leziunile de protecție a datelor ca acestea ar putea avea consecințe reale, cum ar fi discriminarea la locul de muncă, spune Gürsoy. Acesta adaugă că scurgerile ar putea avea chiar un impact asupra generațiilor viitoare, deoarece caracteristicile genetice pot fi transmise urmașilor. „Tot ceea ce se știe despre noi este continuat de generații”, spune ea.
Bradley Malin, care în zona schimbului de date pe scară largă a genomului la Universitatea Vanderbilt din Nashville, Tennessee, Researchs, descrie studiul ca o „nouă extensie și contribuție la literatură”. El adaugă că cercetările viitoare ar putea investiga dacă datele genomului ar putea fi legate și în înregistrări de date mai mari care conțin probe de mii sau milioane de oameni.
interese de concurență
oamenii de știință nu sunt siguri cum să abordeze cel mai bine problemele de protecție a datelor. „Există dorința de a proteja confidențialitatea individului, dar și dorința de a promova cercetarea medicală în mod colectiv, iar acestea, din păcate, sunt în contradicție între ele”, spune Mark Gerstein, care cercetează la Universitatea Yale din New Haven, Connecticut, Medic Data. Cea mai simplă soluție ar fi să îngreuneze accesul la datele genetice, dar asta ar influența negativ cercetările, spune el. „Trebuie să împărtășim și să aglomerăm cantități mari de informații”, explică el. „Dacă blocăm totul și îl facem mai privat, acesta împiedică cu adevărat întregul proces”.
În studiul lor, Gürsoy și colegii ei necesită o transparență mai mare cu privire la riscurile pentru participanții care își împărtășesc datele genomului și sugerează că cercetătorii ar trebui să se asigure că donatorii sunt de acord să transmită datele lor. Un alt mod posibil ar putea fi criptarea datelor cu caracter personal dacă faceți parte dintr -o bază de date publică. Autorii recunosc că acest lucru ar complica procesul de creare și de așteptare a înregistrărilor de date, dar este de părere că ar putea ajuta la protejarea confidențialității participanților.
-
Walker, C. R. și colab. Cell https://doi.org/10.1016/j.cell.2024.09.012 (2024).