Podatność na anonimowe bazy danych genów dla naruszeń ochrony danych
Podatność na anonimowe bazy danych genów dla naruszeń ochrony danych
Badanie wywołało obawy, że rodzaj genetycznej bazy danych, która jest coraz bardziej popularna wśród badaczy, może zostać wykorzystana w celu ujawnienia tożsamości uczestników lub powiązania prywatnych informacji zdrowotnych z ich publicznymi profilem genetycznym.
1 Aby odkryć prywatne informacje o osobach w innym badaniu, „Napisz autorów.
Wyniki podkreślają trudność pogodzenia interesów badaczy z prywatnością dawców. „Nasze genomy są bardzo identyfikują. „Możesz zmienić numer karty kredytowej, jeśli jest to publiczne, ale nie możesz zmienić swojego genomu”.
wrażliwe dane
Rozważ prywatność w genetycznych rekordach danych genetycznych Już wyrażono, ale głównie skupiono się na „genetyce” genetyczne. Zawierają one informacje na temat aktywności genetycznej, które są średnio w dużej populacji komórek, a nie na poszczególnych komórkach.
W przeszłości uważano, że zestawy danych pojedynczych komórek nie były tak podatne na naruszenia ochrony danych, ze względu na poziom „szumu” lub zmienność ekspresji genów między różnymi komórkami. Ale Gürsoy i jej zespół byli w stanie udowodnić, że tak nie jest.Zespół zbadał trzy dostępne publicznie zestawy danych z pojedynczych komórek, które zawierały komórki krwi od osób z toczniem, przewlekłą chorobą samochodu. Naukowcy odkryli, że byli w stanie wykorzystać dane do ekspresji genów, aby przewidzieć strukturę genomu osoby, łącząc te wartości z informacjami o ilościowej cechy ekspresji (EQTLS). Szczegóły różnic EQTLS w chromosomie, które korelują z ekspresją genów-są również publicznie dostępne w zestawach danych jednokomórkowych.
Aby przetestować wiarygodność swojej pracy, naukowcy sprawdzili prognozy genomu na podstawie bazy danych genomu, która odpowiadała użytym komórek. Byli w stanie połączyć większość rekordów danych z odpowiednim genomem, z wskaźnikiem dokładności ponad 80 %.
W przeciwieństwie do danych na temat ekspresji genów i EQTL, kompletne bazy danych genomu mogą być zwykle przeglądane tylko przez naukowców w celu ochrony informacji identyfikacyjnych przed dawcami. Jednak naukowcy zwracają uwagę, że dane genomu uczestnika mogą być publicznie dostępne gdzie indziej. Na przykład mógłbyś przesłać je na witrynie genealogicznej, na której użytkownicy wysyłają próbki DNA, aby dowiedzieć się więcej o ich pochodzeniu. W takim przypadku atakujący może zidentyfikować osobę, której komórki znajdują się w zestawie danych z pojedynczą komórką poprzez analizę ich genomu. Może to odkryć dane osobowe związane z wrażliwą cechą, taką jak zaburzenie psychiczne, ponieważ uczestnicy badań są często wybierani do zbadania biologii tych złożonych warunków.Takie urazy ochrony danych mogą mieć rzeczywiste konsekwencje, takie jak dyskryminacja w miejscu pracy, mówi Gürsoy. Dodaje, że wycieki mogą nawet mieć wpływ na przyszłe pokolenia, ponieważ cechy genetyczne można przekazać potomkom. „Wszystko, co się z nami dowie, jest prowadzone przez pokolenia” - mówi.
Bradley Malin, który w obszarze wymiany danych na dużą skalę na Uniwersytecie Vanderbilt w Nashville w Tennessee, badania, opisuje badanie jako „nowe rozszerzenie i wkład w literaturę”. Dodaje, że przyszłe badania mogą zbadać, czy dane genomu mogą być również powiązane w większych zapisach danych, które zawierają próbki tysięcy lub milionów ludzi.
Zainteresowania konkursowe
Naukowcy nie są pewni, jak najlepiej rozwiązać obawy dotyczące ochrony danych. „Istnieje chęć ochrony prywatności jednostki, ale także chęć wspólnie promowania badań medycznych, a niestety są one sprzeczne ze sobą” - mówi Mark Gerstein, który bada na Uniwersytecie Yale w New Haven, Connecticut, Medical Data. Najprostszym rozwiązaniem byłoby utrudnianie dostępu do danych genetycznych, ale negatywnie wpłynąłoby to na badania, mówi. „Musimy udostępniać i agregować duże ilości informacji” - wyjaśnia. „Jeśli wszystko zablokujemy i uczynimy go bardziej prywatnym, to naprawdę utrudnia cały proces”.
W swoich badaniach Gürsoy i jej koledzy wymagają większej przejrzystości wobec ryzyka dla uczestników, którzy udostępniają dane genomu i sugerują, że badacze powinni zapewnić, że dawcy zgodzili się przekazać swoje dane. Innym możliwym sposobem może być szyfrowanie danych osobowych, jeśli jesteś częścią publicznej bazy danych. Autorzy uznają, że skomplikowałoby to proces tworzenia i oczekiwania danych, ale zdanie, że może pomóc chronić prywatność uczestników.
Kommentare (0)