ضعف قواعد بيانات الجينات المجهولة لانتهاكات البيانات

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

أظهرت دراسة جديدة أن قواعد البيانات الجينية المجهولة معرضة لسرقة الهوية وانتهاك البيانات. ويحذر الباحثون من العواقب.

Eine neue Studie zeigt, dass anonyme genetische Datenbanken anfällig sind für Identitätsdiebstahl und Datenschutzverletzungen. Forschende warnen vor den Folgen.
أظهرت دراسة جديدة أن قواعد البيانات الجينية المجهولة معرضة لسرقة الهوية وانتهاك البيانات. ويحذر الباحثون من العواقب.

ضعف قواعد بيانات الجينات المجهولة لانتهاكات البيانات

أثارت دراسة مخاوف من إمكانية استغلال نوع من قواعد البيانات الجينية التي تحظى بشعبية متزايدة بين الباحثين للكشف عن هويات المشاركين أو ربط المعلومات الصحية الخاصة بملفاتهم الوراثية العامة.

مجموعات بيانات الخلية الواحدة يمكن أن تحتوي على معلومات حول التعبير الجيني في ملايين الخلايا التي تم جمعها من آلاف الأشخاص. غالبًا ما تكون هذه البيانات متاحة مجانًا وتوفر مصدرًا قيمًا للباحثين الذين يدرسون تأثيرات المرض على المستوى الخلوي. ويقال إن البيانات مجهولة المصدر، ولكن دراسة نشرت في 2 أكتوبر في مجلة الخلية 1 يوضح المؤلفون كيف يمكن استغلال البيانات الجينية من إحدى الدراسات للكشف عن معلومات خاصة حول أفراد في دراسة أخرى.

تسلط النتائج الضوء على صعوبة الموازنة بين مصالح الباحثين وخصوصية الجهات المانحة. يقول المؤلف المشارك في الدراسة غامزي جورسوي، الباحث في المعلوماتية الحيوية بجامعة كولومبيا في مدينة نيويورك: "إن جينوماتنا محددة للغاية. ويمكنها أن تقول الكثير عنا، وعن خصائصنا، وقابليتنا للإصابة بالأمراض". "يمكنك تغيير رقم بطاقتك الائتمانية إذا أصبح عامًا، لكن لا يمكنك تغيير الجينوم الخاص بك."

البيانات الحساسة

مخاوف الخصوصية في مجموعات البيانات الجينية لقد أثيرت من قبل، ولكنها ركزت في المقام الأول على "البيانات المجمعة" للملفات الجينية. تحتوي هذه على معلومات حول متوسط ​​نشاط الجينات عبر عدد كبير من الخلايا بدلاً من الخلايا الفردية.

كان يُعتقد سابقًا أن مجموعات البيانات أحادية الخلية لن تكون عرضة لانتهاكات البيانات بسبب مستوى "الضوضاء" أو الاختلاف في التعبير الجيني بين الخلايا المختلفة. لكن غورسوي وفريقها تمكنوا من إثبات أن الأمر ليس كذلك.

قام الفريق بفحص ثلاث مجموعات بيانات متاحة للعامة للخلية الواحدة، والتي تضمنت خلايا دم من أشخاص مصابين بمرض الذئبة، وهو مرض مناعي ذاتي مزمن. ووجد الباحثون أنه يمكنهم استخدام بيانات التعبير الجيني للتنبؤ ببنية جينوم الشخص من خلال الجمع بين هذه القيم ومعلومات حول مواضع السمات الكمية التعبيرية (eQTLs). إن تفاصيل eQTLs - الاختلافات في الكروموسوم التي ترتبط بالتعبير الجيني - متاحة أيضًا للعامة في مجموعات بيانات الخلية الواحدة.

ولاختبار موثوقية عملهم، قام الباحثون بفحص توقعاتهم الجينومية مقابل قاعدة بيانات الجينوم التي تتوافق مع الخلايا المستخدمة. وتمكنوا من ربط معظم مجموعات البيانات بالجينوم المقابل، بمعدل دقة يزيد عن 80%.

على عكس بيانات التعبير الجيني وeQTLs، لا يمكن عادةً عرض قواعد بيانات الجينوم الكاملة إلا من قبل العلماء لحماية المعلومات التعريفية للمانحين. ومع ذلك، لاحظ الباحثون أن البيانات الجينومية الخاصة بالمشارك يمكن أن تكون متاحة للعامة في مكان آخر. على سبيل المثال، ربما قاموا بتحميلها على موقع ويب لعلم الأنساب حيث يقدم المستخدمون عينات من الحمض النووي لمعرفة المزيد عن أسلافهم. في هذه الحالة، يمكن للمهاجم التعرف على الشخص الذي توجد خلاياه في مجموعة بيانات أحادية الخلية من خلال تحليل الجينوم الخاص به. يمكن أن يكشف هذا عن بيانات شخصية مرتبطة بخاصية حساسة مثل اضطراب نفسي، حيث غالبًا ما يتم اختيار المشاركين في البحث لدراسة بيولوجيا هذه الحالات المعقدة.

يقول غورسوي إن مثل هذه الانتهاكات للبيانات يمكن أن يكون لها عواقب حقيقية، مثل التمييز في مكان العمل. وتضيف أن التسريبات يمكن أن تؤثر حتى على الأجيال القادمة لأن السمات الوراثية يمكن أن تنتقل إلى الأبناء. وتقول: "كل ما نعرفه عنا ينتقل عبر الأجيال".

يصف برادلي مالين، الذي يبحث في تبادل البيانات الجينومية على نطاق واسع في جامعة فاندربيلت في ناشفيل بولاية تينيسي، الدراسة بأنها "إضافة جديدة ومساهمة في الأدبيات". ويضيف أن الأبحاث المستقبلية يمكن أن تستكشف ما إذا كان من الممكن أيضًا ربط البيانات الجينومية بمجموعات بيانات أكبر تحتوي على عينات من آلاف أو ملايين الأشخاص.

مصالح المنافسة

العلماء غير متأكدين من أفضل السبل لمعالجة المخاوف المتعلقة بالخصوصية. يقول مارك جيرستين، الذي يبحث في علوم البيانات الطبية في جامعة ييل في نيو هيفن بولاية كونيتيكت: "هناك رغبة في حماية الخصوصية الفردية، ولكن أيضًا هناك رغبة في تطوير الأبحاث الطبية بشكل جماعي، ولسوء الحظ فإن هذه الأمور تتعارض مع بعضها البعض". ويقول إن الحل الأبسط هو جعل الوصول إلى البيانات الجينية أكثر صعوبة، لكن ذلك من شأنه أن يؤثر سلبًا على الأبحاث. ويوضح قائلاً: "نحن بحاجة إلى مشاركة وتجميع كميات كبيرة من المعلومات". "إذا قمنا بحظر كل شيء وجعلناه أكثر خصوصية، فهذا يعيق العملية برمتها حقًا."

في دراستهم، دعت جورسوي وزملاؤها إلى مزيد من الشفافية حول المخاطر التي يتعرض لها المشاركون الذين يشاركون بياناتهم الجينومية، واقترحوا أنه يجب على الباحثين التأكد من موافقة الجهات المانحة على مشاركة بياناتهم. قد يكون هناك طريق آخر محتمل يتمثل في تشفير البيانات الشخصية إذا كانت جزءًا من قاعدة بيانات عامة. يعترف المؤلفون بأن هذا من شأنه أن يعقد عملية إنشاء السجلات والحفاظ عليها، لكنهم يعتقدون أنها يمكن أن تساعد في حماية خصوصية المشاركين.

  1. ووكر، سي آر وآخرون. الخلية https://doi.org/10.1016/j.cell.2024.09.012 (2024).

    شرط
    جوجل الباحث العلمي

تحميل المراجع