Gevoeligheid voor anonieme gendatabases voor overtredingen van gegevensbescherming

Gevoeligheid voor anonieme gendatabases voor overtredingen van gegevensbescherming
Een studie heeft de bezorgdheid opgeleverd dat een soort genetische database die steeds populairder wordt bij onderzoekers, kan worden benut om de identiteit van de deelnemers bekend te maken of om private gezondheidsinformatie te koppelen aan hun publieke genetische profielen.
individuele celtekens Sets individuele celtekens Sets individuele celtekens-links "individuele celtetekens Cellen verzameld door duizenden mensen. Deze gegevens zijn vaak vrij toegankelijk en bieden een waardevolle bron voor onderzoekers die de effecten van ziekten op cellulair niveau onderzoeken. De gegevens moeten worden geanonimiseerd, maar een studie gepubliceerd op 2 oktober in het tijdschriftcel 1 Om privé-informatie over individuen in een andere studie te onthullen ", schrijf de auteurs.
De resultaten benadrukken de moeilijkheid om de belangen van de onderzoekers te verzoenen met de privacy van de donoren. "Onze genomen zijn zeer identificerend. Je kunt veel zeggen over ons, onze kenmerken en onze lonten van ziekte", zegt de co-auteur van de studie, Gamze Gürsoy, bioinformatica-onderzoeker aan de Columbia University in New York City. "U kunt uw creditcardnummer wijzigen als het openbaar is, maar u kunt uw genoom niet veranderen."
Gevoelige gegevens
Overweeg de privacy in genetische gegevensrecords zijn al uitgedrukt op "Genetische profielen. Deze bevatten informatie over genetische activiteit die gemiddeld zijn over een grote celpopulatie en niet over individuele cellen.
In het verleden werd gedacht dat gegevenssets van enkele cellen niet zo vatbaar waren voor schendingen van gegevensbescherming, vanwege het niveau van "ruis" of variatie in genexpressie, tussen de verschillende cellen. Maar Gürsoy en haar team konden bewijzen dat dit niet het geval is.
Het team onderzocht drie openbaar beschikbare datasets met één cel, die bloedcellen bevatten van mensen met lupus, chronische autoziekte. De onderzoekers ontdekten dat ze in staat waren om de gegevens voor genexpressie te gebruiken om de structuur van het genoom van een persoon te voorspellen door deze waarden te combineren met informatie over expressie kwantitatieve kenmerkloci (EQTLS). De details van de EQTLS-variaties in chromosoom, die correleren met genexpressie-zijn ook openbaar toegankelijk in datasets met één cel.
Om de betrouwbaarheid van hun werk te testen, controleerden de onderzoekers hun genoomvoorspellingen op basis van een genoomdatabase die overeenkwam met de gebruikte cellen. Ze konden de meeste gegevensrecords koppelen aan het overeenkomstige genoom, met een nauwkeurigheidspercentage van meer dan 80 %.
In tegenstelling tot de gegevens over genexpressie en EQTL's, kunnen complete genoomdatabases meestal alleen door wetenschappers worden bekeken om de identificerende informatie van de donoren te beschermen. De onderzoekers wijzen er echter op dat de genoomgegevens van een deelnemer ergens anders openbaar kunnen zijn. Je had ze bijvoorbeeld kunnen uploaden op een genealogiewebsite waarop gebruikers DNA -voorbeelden verzenden om meer te weten te komen over hun afdaling. In dit geval zou een aanvaller een persoon kunnen identificeren wiens cellen in een enkele celgegevens zijn ingesteld door hun genoom te analyseren. Dit zou persoonlijke gegevens kunnen ontdekken die gerelateerd zijn aan een gevoelig kenmerk, zoals een psychiatrische aandoening, omdat onderzoeksdeelnemers vaak worden geselecteerd om de biologie van deze complexe omstandigheden te onderzoeken.Dit soort gegevensbescherming zou dit soort dit soort gevolgen kunnen hebben, zoals discriminatie op de werkplek, zegt Gürsoy. Het voegt eraan toe dat lekken zelfs een impact kunnen hebben op toekomstige generaties, omdat genetische kenmerken kunnen worden doorgegeven aan afstammelingen. "Alles wat over ons bekend wordt, wordt generaties lang voortgezet", zegt ze.
Bradley Malin, op het gebied van grootschalige genoomgegevensuitwisseling aan de Vanderbilt University in Nashville, Tennessee, onderzoekt de studie als een "nieuwe uitbreiding en bijdrage aan literatuur". Hij voegt eraan toe dat toekomstig onderzoek zou kunnen onderzoeken of genoomgegevens ook kunnen worden gekoppeld in grotere gegevensrecords die de monsters van duizenden of miljoenen mensen bevatten.
Competitiebelangen
Wetenschappers weten niet zeker hoe ze de zorgen over gegevensbescherming het beste kunnen aanpakken. "Er is een wens om de privacy van het individu te beschermen, maar ook de wens om medisch onderzoek collectief te promoten, en deze zijn helaas in tegenspraak met elkaar", zegt Mark Gerstein, die onderzoekt aan de Yale University in New Haven, Connecticut, Medic -gegevens. De eenvoudigste oplossing zou zijn om toegang tot genetische gegevens moeilijker te maken, maar dat zou onderzoek negatief beïnvloeden, zegt hij. "We moeten grote hoeveelheden informatie delen en verzamelen", legt hij uit. "Als we alles blokkeren en het meer privé maken, belemmert het echt het hele proces."
In hun onderzoek vereisen Gürsoy en haar collega's meer transparantie over de risico's voor deelnemers die hun genoomgegevens delen en suggereren dat onderzoekers ervoor moeten zorgen dat de donoren ermee instemmen hun gegevens door te geven. Een andere mogelijke manier kan de codering van persoonlijke gegevens zijn als u deel uitmaakt van een openbare database. De auteurs erkennen dat dit het proces van het maken en wachten van gegevensrecords compliceert, maar het is van mening dat het de privacy van de deelnemers kan helpen beschermen.
- >
-
Walker, C. R. et al. Cell https://doi.org/10.1016/j.cell.2024.09.012 (2024).