Ευπάθεια των ανώνυμων γονιδιακών βάσεων δεδομένων στις παραβιάσεις δεδομένων
Μια νέα μελέτη δείχνει ότι οι ανώνυμες γενετικές βάσεις δεδομένων είναι ευάλωτες σε κλοπή ταυτότητας και παραβιάσεις δεδομένων. Οι ερευνητές προειδοποιούν για τις συνέπειες.

Ευπάθεια των ανώνυμων γονιδιακών βάσεων δεδομένων στις παραβιάσεις δεδομένων
Μια μελέτη έχει προκαλέσει ανησυχίες ότι ένας τύπος γενετικής βάσης δεδομένων όλο και πιο δημοφιλής μεταξύ των ερευνητών θα μπορούσε να εκμεταλλευτεί για να αποκαλύψει τις ταυτότητες των συμμετεχόντων ή να συνδέσει ιδιωτικές πληροφορίες για την υγεία με τα δημόσια γενετικά τους προφίλ.
Σύνολα δεδομένων μεμονωμένων κυττάρων Μπορεί να περιέχει πληροφορίες σχετικά με την γονιδιακή έκφραση σε εκατομμύρια κύτταρα που συλλέγονται από χιλιάδες ανθρώπους. Αυτά τα δεδομένα είναι συχνά ελεύθερα διαθέσιμα και παρέχουν έναν πολύτιμο πόρο για τους ερευνητές που μελετούν τις επιδράσεις της νόσου σε κυτταρικό επίπεδο. Τα δεδομένα λέγεται ότι είναι ανώνυμα, αλλά μια μελέτη που δημοσιεύθηκε στις 2 Οκτωβρίου στο περιοδικό Cell 1 Δείχνει πώς τα γενετικά δεδομένα από μία μελέτη "μπορούν να εκμεταλλευτούν για να αποκαλύψουν ιδιωτικές πληροφορίες για άτομα σε άλλη μελέτη", γράφουν οι συγγραφείς.
Τα αποτελέσματα υπογραμμίζουν τη δυσκολία της εξισορρόπησης των συμφερόντων των ερευνητών με την ιδιωτική ζωή των δότη. "Τα γονιδιώματα μας αναγνωρίζουν πολύ, μπορούν να πουν πολλά για εμάς, τα χαρακτηριστικά μας και τις ευαισθησίες μας σε ασθένειες", λέει ο συν-συγγραφέας Gamze Gürsoy, ένας ερευνητής βιοπληροφορικής στο Πανεπιστήμιο της Κολούμπια στη Νέα Υόρκη. "Μπορείτε να αλλάξετε τον αριθμό της πιστωτικής σας κάρτας εάν γίνει δημόσια, αλλά δεν μπορείτε να αλλάξετε το γονιδίωμα σας."
Ευαίσθητα δεδομένα
Ανησυχίες για την προστασία της ιδιωτικής ζωής σε γενετικά σύνολα δεδομένων έχουν αυξηθεί πριν, αλλά έχουν επικεντρωθεί κυρίως σε "χύμα δεδομένα" γενετικών προφίλ. Αυτά περιέχουν πληροφορίες σχετικά με τη γονιδιακή δραστηριότητα κατά μέσο όρο σε έναν μεγάλο κυτταρικό πληθυσμό και όχι σε μεμονωμένα κύτταρα.
Θεωρήθηκε προηγουμένως ότι τα σύνολα δεδομένων ενός κυττάρου δεν θα ήταν τόσο ευάλωτα στις παραβιάσεις των δεδομένων λόγω του επιπέδου του "θορύβου" ή της μεταβολής της γονιδιακής έκφρασης μεταξύ διαφορετικών κυττάρων. Αλλά η Gürsoy και η ομάδα της μπόρεσαν να αποδείξουν ότι αυτό δεν συμβαίνει.
Η ομάδα εξέτασε τρία δημόσια διαθέσιμα σύνολα δεδομένων ενός κυττάρου που περιελάμβαναν κύτταρα αίματος από άτομα με λύκο, χρόνια αυτοάνοση ασθένεια. Οι ερευνητές διαπίστωσαν ότι θα μπορούσαν να χρησιμοποιήσουν δεδομένα γονιδιακής έκφρασης για να προβλέψουν τη δομή του γονιδιώματος ενός ατόμου συνδυάζοντας αυτές τις τιμές με πληροφορίες σχετικά με την έκφραση ποσοτικών τόπων χαρακτηριστικών (EQTLs). Οι λεπτομέρειες των eQTL-παραλλαγές στο χρωμόσωμα που συσχετίζονται με την γονιδιακή έκφραση-είναι επίσης διαθέσιμες στο κοινό σε σύνολα δεδομένων ενός κυττάρου.
Για να δοκιμάσουν την αξιοπιστία του έργου τους, οι ερευνητές έλεγξαν τις προβλέψεις γονιδιώματος τους έναντι μιας βάσης δεδομένων γονιδιώματος που αντιστοιχούσε στα χρησιμοποιούμενα κύτταρα. Ήταν σε θέση να συνδέσουν τα περισσότερα σύνολα δεδομένων με το αντίστοιχο γονιδίωμα, με ποσοστό ακρίβειας άνω του 80%.
Σε αντίθεση με τα δεδομένα γονιδιακής έκφρασης και τα eQTLs, οι βάσεις δεδομένων πλήρους γονιδιώματος μπορούν τυπικά να θεωρούνται μόνο από επιστήμονες για την προστασία των πληροφοριών ταυτοποίησης των δωρητών. Ωστόσο, οι ερευνητές σημειώνουν ότι τα γονιδιωματικά δεδομένα ενός συμμετέχοντος θα μπορούσαν να είναι διαθέσιμα δημόσια αλλού. Για παράδειγμα, ενδέχεται να τους έχουν μεταφορτώσει σε μια γενεαλογική ιστοσελίδα όπου οι χρήστες υποβάλλουν δείγματα DNA για να μάθουν περισσότερα για την καταγωγή τους. Σε αυτή την περίπτωση, ένας εισβολέας θα μπορούσε να εντοπίσει ένα άτομο του οποίου τα κύτταρα βρίσκονται σε ένα σύνολο δεδομένων ενός κυττάρου αναλύοντας το γονιδίωμα του. Αυτό θα μπορούσε να αποκαλύψει τα προσωπικά δεδομένα που σχετίζονται με ένα ευαίσθητο χαρακτηριστικό, όπως μια ψυχιατρική διαταραχή, καθώς οι συμμετέχοντες στην έρευνα επιλέγονται συχνά για να μελετήσουν τη βιολογία αυτών των σύνθετων συνθηκών.
Οι παραβιάσεις δεδομένων όπως αυτό θα μπορούσαν να έχουν πραγματικές συνέπειες, όπως οι διακρίσεις στο χώρο εργασίας, λέει ο Gürsoy. Προσθέτει ότι οι διαρροές θα μπορούσαν ακόμη και να επηρεάσουν τις μελλοντικές γενιές, επειδή τα γενετικά χαρακτηριστικά μπορούν να μεταφερθούν στους απογόνους. "Όλα όσα είναι γνωστά για εμάς έχουν περάσει από γενιές", λέει.
Ο Bradley Malin, ο οποίος ερευνά την κοινή χρήση γονιδιωματικών δεδομένων μεγάλης κλίμακας στο Πανεπιστήμιο Vanderbilt στο Νάσβιλ, Τενεσί, περιγράφει τη μελέτη ως «νέα προσθήκη και συμβολή στη βιβλιογραφία». Προσθέτει ότι η μελλοντική έρευνα θα μπορούσε να διερευνήσει εάν τα γονιδιωματικά δεδομένα θα μπορούσαν επίσης να συνδεθούν σε μεγαλύτερα σύνολα δεδομένων που περιέχουν δείγματα από χιλιάδες ή εκατομμύρια ανθρώπους.
συμφέροντα ανταγωνισμού
Οι επιστήμονες δεν είναι σίγουροι για τον καλύτερο τρόπο αντιμετώπισης των ανησυχιών για την προστασία της ιδιωτικής ζωής. "Υπάρχει η επιθυμία να προστατευθεί η ατομική ιδιωτική ζωή, αλλά και η επιθυμία να προωθήσουν συλλογικά την ιατρική έρευνα και δυστυχώς αυτές είναι σε αντίθεση μεταξύ τους", λέει ο Mark Gerstein, ο οποίος ερευνά την ιατρική επιστήμη στο Πανεπιστήμιο Yale στο New Haven του Κοννέκτικατ. Η απλούστερη λύση θα ήταν να καταστούν τα γενετικά δεδομένα πιο δύσκολα στην πρόσβαση, αλλά αυτό θα επηρεάσει αρνητικά την έρευνα, λέει. "Πρέπει να μοιραστούμε και να συγκεντρώσουμε μεγάλα ποσά πληροφοριών", εξηγεί. "Αν μπλοκάρει τα πάντα και το κάνουμε πιο ιδιωτικό, παρεμποδίζει πραγματικά όλη τη διαδικασία."
Στη μελέτη τους, η Gürsoy και οι συνάδελφοί της απαιτούν μεγαλύτερη διαφάνεια σχετικά με τους κινδύνους για τους συμμετέχοντες που μοιράζονται τα γονιδιωματικά τους δεδομένα και υποδηλώνουν ότι οι ερευνητές θα πρέπει να εξασφαλίσουν ότι οι δωρητές συναινούν στην ανταλλαγή δεδομένων. Μια άλλη πιθανή διαδρομή θα μπορούσε να είναι η κρυπτογράφηση των προσωπικών δεδομένων εάν αποτελεί μέρος μιας δημόσιας βάσης δεδομένων. Οι συγγραφείς αναγνωρίζουν ότι αυτό θα περιπλέξει τη διαδικασία δημιουργίας και διατήρησης αρχείων, αλλά πιστεύει ότι θα μπορούσε να βοηθήσει στην προστασία της ιδιωτικής ζωής των συμμετεχόντων.
-
Walker, C.R. et αϊ. Cell https://doi.org/10.1016/j.cell.2024.09.012 (2024).