يساعد الذكاء الاصطناعي (AI) في إعادة رسم شجرة عائلة الفيروسات. هياكل البروتين المتوقعة باستخدام ألفا فولد وتلك المستوحاة من برامج الدردشة الآلية "نماذج لغة البروتين" كشفت عن روابط مفاجئة في عائلة من الفيروسات التي تشمل مسببات الأمراض التي تصيب البشر والتهديدات الناشئة.
جزء كبير من فهم العلماء حول التطور الفيروسي يعتمد على مقارنة الجينومات. ومع ذلك، فإن التطور السريع للفيروسات، وخاصة تلك التي تحتوي على جينومات الحمض النووي الريبوزي (RNA)، وميلها للحصول على المواد الوراثية من كائنات أخرى، يظهر أن التسلسلات الجينية يمكن أن تخفي علاقات أعمق وأكثر بعدًا بين الفيروسات، والتي يمكن أن تختلف اعتمادًا على الجين قيد الدراسة.
في المقابل، تميل أشكال أو هياكل البروتينات المشفرة بواسطة الجينات الفيروسية إلى التغير ببطء، مما يجعل من الممكن اكتشاف هذه الارتباطات التطورية الخفية. ومع ذلك، حتى ظهور أدوات مثل AlphaFold، التي يمكنها التنبؤ بهياكل البروتين على نطاق واسع، لم يكن من الممكن مقارنة هياكل البروتين عبر عائلة كاملة من الفيروسات، كما يقول جو جروف، عالم الفيروسات الجزيئية بجامعة جلاسكو بالمملكة المتحدة.
في مقال نشر هذا الأسبوع فيطبيعة 1يوضح جروف وفريقه قوة النهج القائم على البنية في التعامل مع الفيروسات المصفرة - وهي مجموعة تشمل فيروسات التهاب الكبد الوبائي سي، وحمى الضنك، وزيكا، بالإضافة إلى العديد من مسببات الأمراض الحيوانية المهمة والأنواع التي قد تشكل تهديدات ناشئة على صحة الإنسان.
كيف تغزو الفيروسات
يعتمد فهم الباحثين لتطور الفيروس المصفرة في المقام الأول على تسلسل الإنزيمات بطيئة التطور التي تنسخ مادتها الجينية. ومع ذلك، لا يُعرف سوى القليل عن أصول بروتينات "الدخول الفيروسي" التي تستخدمها الفيروسات المصفرة لدخول الخلايا والتي تحدد المضيف الذي يمكن أن تصيبه. ويقول جروف إن هذه الفجوة المعرفية ستعيق تطوير لقاح فعال ضد المرض التهاب الكبد ج والتي تقتل مئات الآلاف من الأشخاص كل عام.
ويقول: "على مستوى التسلسل، تكون الأمور متباينة للغاية لدرجة أننا لا نستطيع أن نقول ما إذا كانت مرتبطة أم لا". "إن التقدم في التنبؤ ببنية البروتين يفتح الباب أمام السؤال برمته، ويمكننا أن نرى الأمور بوضوح تام."
استخدم الباحثون ديب مايندز ألفا فولد 2 -نموذج و إي إس إم فولد، أ بناء- أداة التنبؤ التي طورتها شركة Meta العملاقة للتكنولوجيا لتوليد أكثر من 33000 بنية متوقعة للبروتينات من 458 نوعًا من الفيروسات المصفرة. يعتمد ESMFold على نموذج لغوي تم تدريبه بعشرات الملايين من تسلسلات البروتين. وعلى عكس AlphaFold، فهو لا يتطلب سوى تسلسل إدخال واحد بدلاً من الاعتماد على تسلسلات متعددة من البروتينات المماثلة، مما قد يجعله مفيدًا بشكل خاص لدراسة الفيروسات الأكثر غموضًا.
        سمحت الهياكل المتوقعة للمؤلفين بتحديد بروتينات الدخول الفيروسية التي تختلف تسلسلاتها بشكل كبير عن تسلسلات الفيروسات المصفرة المعروفة. لقد وجدوا بعض الروابط غير المتوقعة. لذا فإن مجموعة الفيروسات التي تشمل التهاب الكبد C تستخدم نظامًا لإصابة الخلايا مشابهًا لما اكتشفوه مع فيروسات الآفات - وهي مجموعة تشمل فيروس أنفلونزا الخنازير الكلاسيكي، الذي يسبب الحمى النزفية في الخنازير، ومسببات الأمراض الحيوانية الأخرى.
وأظهرت المقارنات المدعومة بالذكاء الاصطناعي أن نظام الإدخال هذا يختلف عن نظام العديد من الفيروسات المصفرة الأخرى. يقول جروف: "بالنسبة لالتهاب الكبد C وأقاربه، لا نعرف من أين يأتي نظام الدخول الخاص بهم. ربما تم اختراعه".
سرقتها البكتيريا
وأظهرت الهياكل المتوقعة أيضًا أن بروتينات المدخلات المدروسة جيدًا لفيروسات زيكا وحمى الضنك لها نفس أصول الفيروسات المصفرة "الغريبة والرائعة" ذات الجينومات الضخمة، بما في ذلك فيروس القراد هاسيكي، الذي يمكن أن يسبب الحمى لدى البشر. وكانت المفاجأة الكبيرة الأخرى هي اكتشاف أن بعض الفيروسات المصفرة تمتلك إنزيمًا يبدو أنه سُرق من البكتيريا.
تقول عالمة الفيروسات ماري بترون من جامعة سيدني بأستراليا: "كان هذا أمراً غير مسبوق"، لولا اكتشاف فريقها هذا العام لسرقة مماثلة لنوع "غريب ورائع" من الفيروسات المصفرة. 2. وتضيف: "ربما لعبت القرصنة الجينية دورًا أكبر في تطور الفيروسات المصفرة مما كان يُعتقد سابقًا".
يقول ديفيد موي، عالم الأحياء الحسابي بجامعة لوزان بسويسرا، إن دراسة الفيروسات المصفرة هي مجرد قمة جبل الجليد، وإن القصص التطورية لفيروسات أخرى، وحتى بعض الكائنات الخلوية، من المرجح أن يتم إعادة سردها باستخدام الذكاء الاصطناعي. ويقول: "الآن بعد أن أصبح بإمكاننا إلقاء نظرة أبعد، تحتاج كل هذه الأشياء إلى تحديث بسيط".
            
				  