article tiré du site du CNRS que vous pouvez retrouver en cliquant ici ou sur le sigle ci-dessous :
10 avril 2020
La recherche internationale sâorganise face au COVID-19 et doit disposer des armes adĂ©quates. Le supercalculateur Jean Zay consacre ainsi son Ă©norme puissance de calcul Ă diffĂ©rents projets de modĂ©lisation molĂ©culaire ou dâoutils de diagnostics.
Face Ă la pandĂ©mie de COVID-191, le CNRS dĂ©ploie les grands moyens avec le supercalculateur Jean Zay. InaugurĂ© en septembre 2019 Ă lâIDRIS2, le centre de calcul intensif du CNRS, voit en temps normal sa puissance partagĂ©e entre environ 300 projets, mobilisant environ 1 200 chercheurs de tous les horizons scientifiques.
LâIDRIS est un des trois centres nationaux Ă©quipĂ©s et coordonnĂ©s depuis 2007 par GENCI3. Alors que les supercalculateurs sont gĂ©nĂ©ralement spĂ©cialisĂ©s dans le calcul scientifique, aussi appelĂ© calcul haute performance (HPC), Jean Zay y adjoint une partition consacrĂ©e spĂ©cifiquement Ă lâintelligence artificielle (IA). «âJean Zay est un des supercalculateurs les plus puissants dâEurope, tant sur sa partie convergĂ©e que non convergĂ©eâ»,âaffirme Pierre-François LavallĂ©e, directeur de lâIDRIS. Dans le cas de recherches sur un nouveau virus, sa partition « non convergĂ©e » – basĂ©e sur des processeurs classiques (CPU) – est capable dâeffectuer des simulations extrĂȘmement complexes, comme celles dâinteractions molĂ©culaires qui permettraient de trouver des moyens, et donc des composĂ©s, capables dâaffecter le virus dâune maniĂšre ou dâune autre. La partie dite « convergĂ©e » de Jean Zay – un mĂ©lange de processeurs classiques (CPU) et graphiques (GPU) – peut non seulement optimiser ce mĂȘme type de simulations, mais aussi utiliser lâIA pour aider les chercheurs Ă mieux diagnostiquer des radios ou scanners, par exemple.NĆuds de calcul du supercalculateur Jean Zay. Chaque nĆud dispose de 192 Go de mĂ©moire et chaque GPU de 32 Go. © Cyril Fresillon/IDRIS/CNRS PhotothĂšque
Mobilisation et modélisation
«âPour le coronavirus, en collaboration avec GENCI, nous avons dĂ» lancer un appel dâoffres pour des chercheurs Ă la fois compĂ©tents dans le domaine et capables dâĂȘtre immĂ©diatement opĂ©rationnels », prĂ©cise Pierre-François LavallĂ©e. « LâIDRIS a ensuite aidĂ© Ă adapter, optimiser et mettre en place les simulations.â» En temps normal, les attributions dâheures de calcul sont Ă©valuĂ©es deux fois par an, pour partager 16 pĂ©taflops, câest-Ă -dire seize millions de milliards dâopĂ©rations en virgule flottante effectuĂ©es en une seule seconde, mais les projets consacrĂ©s Ă la lutte contre le virus SARS-CoV-2 sont devenus totalement prioritaires.
Certains chercheurs Ă©taient dĂ©jĂ prĂȘts. Jean-Philip Piquemal, directeur du Laboratoire de chimie thĂ©orique (LCT)4, optimisait ainsi depuis un an ses modĂšles et ses codes de design de mĂ©dicaments pour le supercalculateur. Alors quâil Ă©tudiait surtout le VIH, il a pu se tourner dĂšs le dĂ©but de lâĂ©pidĂ©mie vers la nouvelle menace. En plus de son Ă©quipe du LCT, Jean-Philip Piquemal est Ă©paulĂ© par des chercheurs du CNAM5, du laboratoire XLIM6 et des universitĂ©s amĂ©ricaines dâAustin au Texas et de Saint-Louis dans le Missouri.
«âAu LCT, nous avons dĂ©veloppĂ© le code Tinker-HP, dĂ©diĂ© Ă la modĂ©lisation molĂ©culaire », annonce Jean-Philip Piquemal. « Il permet des calculs particuliĂšrement prĂ©cis, mais demande du matĂ©riel informatique consĂ©quent.â» Ces chercheurs en chimie thĂ©orique sâintĂ©ressent Ă la protĂ©ine Spike, qui forme les picsâque lâon voit Ă la surface du virus, et qui lui sert Ă reconnaĂźtre et interagir avec les cellules humaines.
Ă dĂ©faut de dĂ©truire le pathogĂšne, dĂ©samorcer cette protĂ©ine empĂȘcherait le virus de pĂ©nĂ©trer et dâinfecter des cellules hĂŽtes. Sa taille et sa complexitĂ© alourdissent cependant les calculs et modĂ©lisations. «âNous rencontrons le mĂȘme problĂšme quâavec le VIH », poursuit Jean-Philip Piquemal, « avec des protĂ©ines qui mutent souvent et risquent de rendre potentiellement inefficaces les solutions que lâon trouverait. Or certaines parties de la protĂ©ine Spike sont trĂšs conservĂ©es au cours de lâĂ©volution des coronavirus, des stratĂ©gies de criblage virtuel peuvent donc identifier des molĂ©cules capables dâempĂȘcher lâentrĂ©e du virus. Afin dâattaquer COVID-19 sous plusieurs angles, nous nous intĂ©ressons aussi Ă bloquer la machinerie interne des pathogĂšnes en modĂ©lisant dâautres protĂ©ines telles les diverses protĂ©ases ou la polymĂ©rase, qui sont moins susceptibles de muter.â»ModĂ©lisation de lâinteraction et la liaison entre une partie de la protĂ©ine Spike de n-SARS-Cov-2 (en vert) et une partie du rĂ©cepteur humain ACE2 reprĂ©sentant la premiĂšre Ă©tape de lâentrĂ©e du virus dans la cellule hĂŽte. ©LCPT
Atteindre un modĂšle Ă 250 millions dâatomes
Le modĂšle actuel du virus comporte jusquâĂ cinq millions dâatomes, un chiffre dĂ©jĂ colossal alors que lâobjectif est dâatteindre les 250 millions. Une taille qui dĂ©passe largement les capacitĂ©s dâordinateurs classiques, qui plus est dans le contexte trĂšs particulier dâun adversaire dont on ne connaĂźt pas encore grand-chose. «âPour ne pas travailler dans le vide, nous devons peaufiner nos modĂšles avec les nouvelles donnĂ©es expĂ©rimentales obtenues par dâautres Ă©quipes », souligne le chercheur. « Nous nâavions que trĂšs peu dâinformations fiables sur le virus ne serait-ce que le mois dernier. Mais au moins nous bĂ©nĂ©ficions de la puissance de Jean Zay et de ses 1 300 processeurs GPU, chacune aussi puissante quâun millier de processeurs grand public.â»
Contrer la transmission du virus
De son cĂŽtĂ©, Antonio Monari est responsable de SeekAndDestroy au Laboratoire de physique et chimie thĂ©oriques (LPCT)7, qui rassemble des scientifiques de Nancy, AlcalĂ de HĂ©nares (Madrid) et Palerme. «âNotre projet vise Ă modĂ©liser au niveau molĂ©culaire les systĂšmes biologiques qui assurent la transmission du virus », introduit le chercheur. « Nos deux cibles sont les protĂ©ines Spike, qui permet lâentrĂ©e du virus dans les cellules humaines, et SARS unique domain, prĂ©sente dans tous les virus de cette famille et les aidant Ă rĂ©sister au systĂšme immunitaire.â»
Sars unique domain utilise le repli dâun brin dâARN pour ne pas ĂȘtre reconnu par les lymphocytes. Une ruse que les chercheurs tentent de dĂ©jouer, avec lâespoir quâelle soit aussi valable contre les autres coronavirus, y compris ceux qui pourraient apparaĂźtre plus tard. Ces deux pistes reposent en tout cas sur des simulations de dynamique molĂ©culaire, afin de dĂ©crire comment les protĂ©ines Ă©voluent et interagissent. Cela donnerait ensuite une idĂ©e des mĂ©dicaments capables de perturber le virus, en se substituant aux liaisons quâil utilise pour infecter et se dĂ©fendre.
«âLa puissance de calcul offerte par Jean Zay est fondamentale, pour obtenir des rĂ©sultats le plus tĂŽt possible et en testant un maximum de molĂ©cules », affirme Antonio Monari. « Sans cela, le danger serait de devoir laisser de cĂŽtĂ© certaines solutions. Le supercalculateur permet Ă©galement de prolonger la durĂ©e de chaque simulation, car les interactions entre macromolĂ©cules biologiques peuvent demander du temps.â»
Mustafa Tekpinar, du laboratoire Biologie molĂ©culaire structurale et processus infectieux8, souligne lui aussi lâimportance de la protĂ©ine Spike, mais sâintĂ©resse surtout Ă la protĂ©ase de SARS-CoV-2. Cette enzyme, dont lâĂ©quivalent chez le VIH, le SARS9 ou le MERS10 avait dĂ©jĂ Ă©tĂ© Ă©tudiĂ©, est une cible viable pour le dĂ©veloppement dâun vaccin. Il modĂ©lise donc les interactions de la molĂ©cule avec des collĂšgues de lâInstitut Pasteur et de lâuniversitĂ© turque de Siirt.ReprĂ©sentation de l’interaction de la protĂ©ine Spike avec le rĂ©cepteur ACE-2 de la cellule-cible humaine (en gris). Image issue de simulations HPC rĂ©alisĂ©es Ă Sorbonne UniversitĂ© Ă l’aide du supercalculateur Jean Zay CNRS/GENCI et du logiciel Tinker-HP. © UniversitĂ© de Limoges/CNAM, visualiseur VTX
Lâobjectif est dâinhiber la protĂ©ase grĂące Ă des interactions allostĂ©riques, oĂč une molĂ©cule, en sâaccrochant Ă distance dâun site actif, empĂȘche la protĂ©ine de fonctionner et donc le pathogĂšne de se rĂ©pliquer. LĂ encore, le manque dâinformations sur le virus freine la recherche, dâoĂč lâimportance de mieux en connaĂźtre les mĂ©canismes. La protĂ©ase prĂ©sente nĂ©anmoins un avantage technique trĂšs prosaĂŻque : lâenzyme est relativement petite et donc plus facile Ă modĂ©liser.
«âAprĂšs le SARS, le MERS, Ebola et Zika, COVID-19 est la cinquiĂšme Ă©pidĂ©mie virale majeure de ces vingt derniĂšres annĂ©es », sâinquiĂšte Mustafa Tekpinar. « Nous savons quâil y en aura dâautres et que nous devons envisager diffĂ©rentes solutions pour les combattre, en prenant en compte les possibilitĂ©s de mutation. Certaines options ne vont rien donner, mais dâautres seront de vĂ©ritables mines thĂ©rapeutiques.â»
Les pistes sont en tout cas nombreuses, rien quâautour de Jean Zay. «âDâautres projets utilisent par exemple lâIA pour diagnostiquer des radios ou scanners des poumons », cite Pierre-François LavallĂ©e. « Les rĂ©seaux de neurones ont besoin de beaucoup de donnĂ©es et dâentraĂźnement pour apprendre Ă repĂ©rer la maladie.â» De quoi faire tourner le supercalculateur Ă plein rĂ©gime pour un bon bout de temps. BaptisĂ© en hommage Ă lâancien ministre de lâĂducation nationale et des Beaux-arts, trĂšs impliquĂ© dans la crĂ©ation du CNRS et assassinĂ© par la Milice en 1944, Jean Zay combat Ă nouveau une menace mondiale.
Notes
- La maladie provoquĂ©e par le virus SARS-CoV-2, un nouveau coronavirus identifiĂ© en janvier 2020, a Ă©tĂ© nommĂ©e COVID-19 par lâOrganisation mondiale de la SantĂ© (OMS). Les coronavirus sont une grande famille de virus qui provoquent des maladies allant dâun simple rhume Ă des pathologies plus sĂ©vĂšres comme le SRAS-CoV ou le Mers-CoV
- Institut du développement et des ressources en informatique scientifique (CNRS)
- Grand équipement national de calcul intensif
- Laboratoire de chimie théorique (CNRS/Sorbonne Université)
- Laboratoire Génomique, bioinformatique et chimie moléculaire (GBCM) du Conservatoire national des arts et métiers (CNAM)
- Laboratoire XLIM (CNRS/Université de Limoges)
- Laboratoire de physique et chimie théoriques (CNRS/Université de Lorraine)
- Biologie moléculaire structurale et processus infectieux (CNRS/Institut Pasteur)
- La premiĂšre forme de syndrome respiratoire aigu sĂ©vĂšre est apparue en Chine en 2002, provoquant une Ă©pidĂ©mie lâannĂ©e suivante. Les mĂ©dias employaient alors lâacronyme francisĂ© SRAS
- Coronavirus du syndrome respiratoire du Moyen-Orient, apparu pour la premiĂšre fois en Arabie Saoudite en 2012