Une nouvelle base de données permettant aux chercheurs de partager les génomes de virus dangereux promet de résoudre bon nombre des problèmes qui entravent les alternatives existantes. Mais il faut d’abord convaincre les chercheurs de les utiliser.

Pathoplexus - une combinaison d'agent pathogène et de plexus - a été lancé le mois dernier, et l'équipe de scientifiques à l'origine de la base de données espère qu'elle motivera davantage de chercheurs à partager des séquences génétiques de virus connus et émergents ayant une importance pour la santé publique.

Partager les séquences le plus rapidement possible est important pour identifier de nouveaux virus et suivre les changements qui pourraient les rendre plus dangereux pour les humains, ainsi que pour développer des vaccins, explique Edward Holmes, virologue à l'Université de Sydney, en Australie.

Pathoplexus se concentre actuellement sur quatre virus qui ne sont pas spécifiquement répertoriés dans d'autres bases de données : le virus de la fièvre hémorragique de Crimée-Congo, Ebola Soudan, Ebola Zaïre et le virus du Nil occidental. D'autres agents pathogènes seront ajoutés ultérieurement, a indiqué l'équipe.

Obstacles existants

Parmi les plus grands référentiels existants figure GenBank aux États-Unis, qui offre un accès illimité à ses données génomiques. Mais l’accès public signifie qu’en théorie, n’importe qui peut utiliser les données pour publier des articles scientifiques sans en reconnaître les propriétaires. Cela a découragé les scientifiques, en particulier ceux des pays à faible revenu, de partager rapidement leurs données, par exemple lors d'une urgence de santé publique. Un référentiel alternatif, GISAID, exige que les utilisateurs s'inscrivent, reconnaissent les propriétaires des données et fassent de leur mieux pour coopérer avec les propriétaires. La base de données a été développée pour garantir les droits des déclarants de données.

GISAID a été extrêmement utile pendant la pandémie de COVID-19 populaire et contient près de 17 millions de séquences du SRAS-CoV-2, le virus à l’origine du COVID-19. Cependant, les chercheurs s'inquiètent du transparence dans sa gouvernance, comment il arbitre les litiges de reconnaissance et comment il impose des sanctions à ceux qui, selon lui, ont violé les conditions d'utilisation.

« GISAID a provoqué beaucoup de frustration ces dernières années », déclare Spyros Lytras, virologue évolutionniste à l'Université de Tokyo. "De ces expériences, la communauté scientifique a appris comment faire mieux. Une réinitialisation est ce dont nous avons besoin en tant que communauté, et Pathoplexus pourrait être la solution."

Un représentant du GISAID a déclaré dans un courrier électronique que la confiance qu'il entretient avec la communauté scientifique est forte et que plus de 70 000 chercheurs utilisent le site. Les rôles de ses organes de gouvernance et de ses bailleurs de fonds sont présentés sur le site Internet, et leurs conditions d'utilisation n'ont pas changé depuis sa création en 2008, a déclaré le représentant.

Établir la confiance

Pathoplexus offre certaines protections aux utilisateurs. Par exemple, les chercheurs peuvent définir des restrictions sur la manière dont leurs données peuvent être utilisées, par exemple elles ne peuvent pas être utilisées comme élément central de publications scientifiques pendant une période pouvant aller jusqu'à un an sans leur autorisation expresse. Cela devrait donner aux propriétaires de données suffisamment de temps pour soumettre un manuscrit sur leurs résultats.

Les utilisateurs doivent également mentionner les propriétaires des données dans leurs publications. «Nous avons l'intention de construire une communauté où les chercheurs ont l'assurance que leurs contributions sont respectées et correctement reconnues», déclare Jamie Southgate, membre de Pathoplexus et directeur des opérations de la coalition mondiale Public Health Alliance for Genomic Epidemiology basée à Cape Town, en Afrique du Sud.

Pathoplexus n'empêchera pas toute personne qui enfreint les conditions d'utilisation d'accéder au site, ce qui GISAID l'a fait dans de rares cas. Au lieu de cela, l'équipe contactera les revues pour s'assurer que les données publiées sont utilisées conformément à la manière dont elles ont été partagées, explique Emma Hodcroft, co-fondatrice de Pathoplexus et épidémiologiste moléculaire à l'Institut suisse de santé tropicale et publique de Bâle, en Suisse. « Nous avons essayé de rendre les conditions incroyablement claires », dit-elle.

"C'est une bonne et intelligente solution", déclare Senjuti Saha, microbiologiste moléculaire à la Child Health Research Foundation de Dhaka, qui soutient la pratique consistant à contacter les éditeurs. "C'est comme ça que ça devrait être." Elle pense que la transparence de Pathoplexus augmentera la confiance au sein de la communauté scientifique.

Mais il est encore trop tôt pour dire si le référentiel résoudra les problèmes actuels de partage de données, estime Saha. "C'est une première étape excellente et fantastique."

Les utilisateurs peuvent également avoir tendance à partager des séquences dans des bases de données locales. En Chine, par exemple, les chercheurs sont plus susceptibles de publier des séquences de virus émergents dans des bases de données chinoises, explique Shi Mang, biologiste évolutionniste à l'Université Sun Yat-sen de Shenzhen, en Chine, qui siège également au conseil consultatif scientifique de Pathoplexus. Mais pour les virus établis, ils utiliseront probablement des référentiels avec des collections bien entretenues proposées par Pathoplexus.

Expérience utilisateur améliorée

Les développeurs de Pathoplexus ont essayé d'améliorer l'expérience utilisateur, notamment en rendant le téléchargement aussi simple que possible. Pathoplexus vérifie également les données de séquence et les informations qui les accompagnent pour détecter les erreurs et aide à organiser les virus en sous-types. "C'est en fait ce qui m'a attiré vers cette base de données", explique Shi. Des séquences incorrectes dans les référentiels actuels peuvent gêner considérablement les chercheurs, ajoute-t-il.

Jusqu’à présent, Pathoplexus a utilisé les données GenBank des quatre virus pour alimenter le site. Des milliers de visiteurs ont déjà accédé au site et 50 ont créé des comptes pour soumettre des données, mais personne n'a soumis de séquences jusqu'à présent, explique Hodcroft. « Nous ne nous attendions pas à obtenir de grandes quantités de données sur les agents pathogènes avec lesquels nous avons commencé. »

Les chercheurs travaillant sur d’autres virus devront attendre que la base de données s’agrandisse pour les inclure. Pour se développer, l’équipe doit obtenir un financement à long terme. Le site est actuellement géré par des bénévoles et du temps informatique donné, qui prendra fin dans environ six mois. Hodcroft dit que son objectif actuel est d'attirer des donateurs. "Je suis prudemment optimiste."