حساسية لقواعد بيانات الجينات المجهولة لانتهاكات حماية البيانات

أظهرت دراسة جديدة أن قواعد البيانات الوراثية المجهولة عرضة لسرقة الهوية وانتهاكات حماية البيانات. يحذر الباحثون من العواقب.
(Symbolbild/natur.wiki)

حساسية لقواعد بيانات الجينات المجهولة لانتهاكات حماية البيانات

أثارت الدراسة مخاوف من أن نوعًا من قاعدة البيانات الوراثية التي تحظى بشعبية متزايدة لدى الباحثين يمكن استغلالها للكشف عن هوية المشاركين أو ربط المعلومات الصحية الخاصة مع ملفاتهم الوراثية العامة.

1 للكشف عن معلومات خاصة حول الأفراد في دراسة أخرى ، "كتابة المؤلفون.

تؤكد النتائج على صعوبة التوفيق بين مصالح الباحثين بخصوصية المانحين. يقول المؤلف المشارك للدراسة ، Gamze Gürsoy ، باحث المعلوماتية الحيوية بجامعة كولومبيا في مدينة نيويورك: "تحدد جينوماتنا للغاية. يمكنك أن تقول الكثير عنا وخصائصنا وفتحنا من المرض". "يمكنك تغيير رقم بطاقة الائتمان الخاصة بك إذا كانت عامة ، لكن لا يمكنك تغيير الجينوم الخاص بك."

البيانات الحساسة

في الماضي ، كان يعتقد أن مجموعات بيانات الخلية الواحدة لم تكن عرضة لانتهاكات حماية البيانات ، بسبب مستوى "الضوضاء" ، أو التباين في التعبير الجيني ، بين الخلايا المختلفة. لكن جورسوي وفريقها تمكنوا من إثبات أن هذا ليس هو الحال.

فحص الفريق ثلاث مجموعات بيانات خلايا واحدة متاحة للجمهور ، والتي تحتوي على خلايا الدم من الأشخاص الذين يعانون من مرض الذئبة ، وأمراض السيارة المزمنة. وجد الباحثون أنهم كانوا قادرين على استخدام البيانات للتعبير الجيني للتنبؤ ببنية جينوم الشخص من خلال الجمع بين هذه القيم مع معلومات حول مواقع السمات الكمية التعبير (EQTLS). تفاصيل اختلافات EQTLS في الكروموسوم ، والتي ترتبط بالتعبير الجيني-يمكن الوصول إليها بشكل عام في مجموعات بيانات الخلية المفردة.

من أجل اختبار موثوقية عملهم ، فحص الباحثون توقعات الجينوم الخاصة بهم بناءً على قاعدة بيانات الجينوم التي تتوافق مع الخلايا المستخدمة. تمكنوا من ربط معظم سجلات البيانات بالجينوم المقابل ، بمعدل دقة يزيد عن 80 ٪.

على عكس البيانات المتعلقة بالتعبير الجيني و EQTLs ، لا يمكن عادةً عرض قواعد بيانات الجينوم الكاملة إلا من قبل العلماء من أجل حماية معلومات التعريف من المانحين. ومع ذلك ، يشير الباحثون إلى أن بيانات الجينوم الخاصة بالمشارك يمكن أن تكون متاحة للجمهور في مكان آخر. على سبيل المثال ، كان بإمكانك تحميلها على موقع ويب لعلم الأنساب الذي يرسل المستخدمون عينات من الحمض النووي لمعرفة المزيد عن نزولهم. في هذه الحالة ، يمكن للمهاجم تحديد الشخص الذي تكون خلاياه في بيانات خلية واحدة من خلال تحليل جينومه. يمكن أن يكشف هذا عن البيانات الشخصية المرتبطة بميزة حساسة مثل الاضطراب النفسي ، حيث يتم اختيار المشاركين في الأبحاث في كثير من الأحيان لفحص بيولوجيا هذه الظروف المعقدة.

يمكن أن يكون لإصابات حماية البيانات مثل هذه عواقب حقيقية ، مثل التمييز في مكان العمل ، كما يقول Gürsoy. ويضيف أن التسريبات يمكن أن يكون لها تأثير على الأجيال القادمة ، حيث يمكن نقل الميزات الوراثية إلى أحفاد. وتقول: "كل ما يعرف عنا يتم تنفيذه من قبل الأجيال".

برادلي مالين ، الذي في منطقة تبادل بيانات الجينوم على نطاق واسع في جامعة فاندربيلت في ناشفيل بولاية تينيسي ، يصفون الدراسة بأنها "امتداد جديد ومساهمة في الأدب". ويضيف أن الأبحاث المستقبلية يمكن أن تحقق ما إذا كان يمكن أيضًا ربط بيانات الجينوم في سجلات البيانات الأكبر التي تحتوي على عينات من الآلاف أو الملايين من الأشخاص.

مصالح المنافسة

العلماء غير متأكدين من أفضل السبل لمعالجة مخاوف حماية البيانات. يقول مارك جيرستين ، الذي يبحث في جامعة ييل في نيو هافن ، كونيتيكت ، "هناك رغبة في حماية خصوصية الفرد ، ولكن أيضًا الرغبة في الترويج للبحوث الطبية بشكل جماعي ، وهذه للأسف تتناقض مع بعضها البعض". ويقول إن أبسط الحلول هو إمكانية الوصول إلى البيانات الوراثية أكثر صعوبة ، لكن هذا من شأنه أن يؤثر سلبًا على الأبحاث. "علينا أن نشارك وتجميع كميات كبيرة من المعلومات" ، يوضح. "إذا حظرنا كل شيء وجعلناه أكثر خصوصية ، فإنه يعيق العملية برمتها."

في دراستهم ، يتطلب Gürsoy وزملاؤها شفافية أكبر حول مخاطر المشاركين الذين يشاركون بيانات الجينوم الخاصة بهم ويقترحون أن يضمن الباحثون أن الموافقة على نقل بياناتهم. هناك طريقة أخرى محتملة يمكن أن تكون تشفير البيانات الشخصية إذا كنت جزءًا من قاعدة بيانات عامة. يدرك المؤلفون أن هذا من شأنه أن يعقد عملية إنشاء سجلات البيانات وانتظارها ، ولكن من الرأي أنه يمكن أن يساعد في حماية خصوصية المشاركين.

  1. Walker ، C. R. et al. الخلية https://doi.org/10.1016/j.cell.2024.09.012 (2024).