Projets

Active-Multi-MOF

Titre complet : Active-MOF

Chercheurs impliqués : François-Xavier Coudert (Chimie ParisTech - PSL), Georges Moouchaham (ENS - PSL)

Ce projet vise à développer une approche basée sur les données pour optimiser la synthèse de structures métallo-organiques multivariées (MOF) à l'aide de méthodes d'apprentissage actif afin de stimuler la synthèse robotisée à haut débit. Les méthodes traditionnelles de découverte des MOF reposent sur le hasard, le criblage computationnel étant incapable de prédire la synthétisabilité ou de contrôler les conditions de synthèse. En intégrant l'acquisition de données expérimentales à l'apprentissage automatique, ce projet vise à explorer systématiquement l'effet des paramètres de synthèse et à contribuer à raccourcir la boucle de découverte des MOF. L'optimisation bayésienne guidera la sélection des expériences, minimisant les coûts et maximisant les connaissances. Nous développerons cette méthodologie sur une famille spécifique de matériaux : les MOF multivariés. Les MOF à ligands mixtes ou à métaux mixtes peuvent offrir une adsorption et une activité catalytique améliorées par rapport à leurs composés parents, mais sont difficiles à caractériser en raison de leur complexité structurelle. L'étude est divisée en trois phases :

  • optimisation de la synthèse du MOF CALF-20
  • contrôle du polymorphisme dans les MOF CALF-20 à liaisons mixtes
  • extension des méthodes aux MOF hétérométalliques de la famille MIP-212 pour une meilleure adsorption du CO2

Cette intégration innovante de l'apprentissage actif et de la robotique offre une approche plus systématique de la découverte de matériaux, en mettant l'accent sur l'efficacité en termes de données et de produits chimiques.

----------------------------------------------------------------------------------------------------

React-IR

Titre complet : Amélioration de l'optimisation des processus chimiques basée sur les données grâce à une surveillance en temps réel à l'aide de React-IR

Chercheurs impliqués : Jean-François Soulé (Chimie ParisTech - PSL), Guillaume Lefèvre (Chimie ParisTech - PSL), Phannarath Phansavath (Chimie ParisTech - PSL), Virginie Vidal (Chimie ParisTech - PSL), Amandine Guérinot (ESPCI Paris - PSL), Benjamin Laroche (ESPCI Paris - PSL), Christophe Meyer (ESPCI Paris - PSL), Renaud Nicolaÿ (ESPCI Paris - PSL), Nathan Van Zee (ESPCI Paris - PSL), Laurence Grimaud (ENS - PSL), Maxime Vitale (ENS - PSL)

Ce projet d'infrastructure vise à acquérir un système React-IR, un outil de spectroscopie infrarouge en temps réel permettant de surveiller en continu les réactions. En fournissant des données cinétiques in situ à haute résolution, il améliorera la reproductibilité et la fiabilité des résultats expérimentaux, essentielles pour constituer des ensembles de données de taille moyenne utilisés dans l'optimisation des réactions assistée par l'IA et les études mécanistiques. Au-delà de ses applications expérimentales, React-IR sera intégré à l'infrastructure de données de PSL, garantissant ainsi le stockage structuré et l'accessibilité des données expérimentales. Les ensembles de données standardisés générés contribueront au PSL Data Hub, créant ainsi une ressource précieuse pour la modélisation des réactions et l'analyse prédictive basées sur l'IA. Cette initiative renforcera le leadership de PSL dans le domaine de la chimie basée sur les données, favorisant la collaboration entre les chimistes expérimentaux, les scientifiques des données et les chercheurs en IA. L'équipement transportable sera mis à la disposition de plusieurs groupes de recherche de Chimie ParisTech-PSL, ESPCI Paris-PSL et ENS-PSL, ce qui permettra de faire progresser la recherche dans les domaines de la synthèse organique, de la catalyse et de la science des matériaux.

----------------------------------------------------------------------------------------------------

Active-MOF

Titre complet : Active-MOF

Chercheurs impliqués : Georges Mouchaham (ENS - PSL), François-Xavier Coudert (Chimie ParisTech - PSL)

Ce projet d'infrastructure vise à moderniser notre robot de synthèse automatisé à haut débit de pointe afin de doubler sa capacité de criblage. Ce projet vise à soutenir le projet de doctorat Active-Multi-MOF, qui vise à développer une approche basée sur les données pour optimiser la synthèse de structures métallo-organiques multivariées (MOF) à l'aide de méthodes d'apprentissage actif afin de piloter la synthèse robotisée à haut débit. À ce jour, la grande majorité des méthodes de découverte des MOF reposent sur le hasard, le criblage computationnel étant incapable de prédire la synthétisabilité ou de contrôler les conditions de synthèse. En intégrant l'acquisition de données expérimentales à l'apprentissage automatique, le projet vise à explorer systématiquement l'effet des paramètres de synthèse et à contribuer à raccourcir la boucle de découverte des MOF. L'optimisation bayésienne guidera la sélection des expériences, minimisant les coûts et maximisant les connaissances. Nous développerons cette méthodologie sur une famille spécifique de matériaux : les MOF multivariés. En effet, les MOF à ligands mixtes ou à métaux mixtes peuvent offrir une adsorption, une séparation ou une activité catalytique améliorées par rapport à leurs composés parents, mais ils sont difficiles à caractériser en raison de leur complexité structurelle et/ou de la nécessité d'appliquer des processus d'activation minutieux. Cette intégration innovante de l'apprentissage actif et de la robotique offre une approche plus systématique de la découverte de matériaux, en mettant l'accent sur l'efficacité tant en termes de données que de produits chimiques.

----------------------------------------------------------------------------------------------------

ChemGenRNA

Titre complet : Chemistry-informed deep generative models for catalytic RNA


Chercheurs impliqués :Vaitea Opuu (ESPCI Paris - PSL), Guillaume Stirnemann (ENS - PSL)

Les ARN catalytiques jouent un rôle essentiel dans divers processus biologiques. Cependant, notre compréhension limitée de la relation entre leur séquence et leur fonction entrave la conception rationnelle de systèmes moléculaires à base d'ARN, qui présentent un potentiel considérable dans les domaines de la biologie synthétique, de la thérapeutique et de la biotechnologie. Contrairement aux protéines, pour lesquelles on dispose de nombreuses données sur la structure moléculaire, les ARN catalytiques souffrent d'un manque de données expérimentales détaillées sur leurs sites catalytiques. Par conséquent, les modèles d'apprentissage profond (DL) qui excellent pour les protéines sont souvent moins performants lorsqu'ils sont appliqués à la conception d'ARN ou à la prédiction fonctionnelle. Des travaux préliminaires ont démontré le potentiel des approches hybrides biophysique-DL pour pallier le manque de données, mais ils se limitaient à la capture de la forme globale de l'ARN, omettant les détails au niveau atomique essentiels à la catalyse. Partant de là, le projet actuel vise à intégrer la simulation, la science des données et les mesures expérimentales à haut débit afin de faire progresser la conception d'ARN de pointe en :

  • utilisant des algorithmes DL modernes capables d'apprendre à partir de diverses sources de données expérimentales
  • intégrant des contraintes de modèles basés sur la chimie afin de garantir que les ARN générés forment des structures moléculaires catalytiquement solides

Notre objectif ultime est de surmonter les limites des données et de permettre la conception rationnelle d'ARN catalytiques avec une activité améliorée et une diversité séquentielle et structurelle élargie, suivie d'une validation expérimentale rigoureuse. Cette approche ouvrira la voie à la conception de nouveaux catalyseurs à base d'ARN dotés de fonctionnalités supérieures, ouvrant ainsi de nouvelles perspectives dans les domaines de la biologie synthétique, des thérapies et des biotechnologies.