Personnes impliquées au LRCS:Arnaud DEMORTIERE, Justine JEAN, Charles DELACOURT, Alejandro FRANCO.
Développement d’outils et d’algorithmes pour le traitement des données
La science des données est un domaine indispensable à l’analyse complexe des données de grande taille issues des instruments modernes de caractérisation. Mettre en forme, nettoyer, transformer et enrichir font partie des étapes importantes de préparation des données qui doivent être optimisées et automatisées pour répondre aux contraintes du bigdata.
Au LRCS, depuis 2018, nous avons élaboré des pipelines (Python et Java) de préparation de données adaptés à différentes techniques permettant de réaliser des analyses complexes de qualité et d’avoir des approches statistiques pertinentes afin d’évaluer la confiance et la robustesse des résultats. Des approches d’aide à la prise de décision ont également été développées pour faciliter certaine étape dans les pipelines (Clustering NMF). Les données ont été traitées par des algorithmes de réduction de données (4D-STEM), de clustering (diffraction), de pattern matching (ACOM) et de classification (STXM-XANES). Notre groupe de recherche s'est concentré sur l'avancement des techniques d'analyse pour les matériaux de batteries, comme illustré dans la figure 1. Nos efforts comprennent le développement de plusieurs algorithmes innovants. Premièrement, nous avons créé un algorithme destiné à identifier les différentes phases présentes dans les cartes STXM XANES spécifiques à la cathode NVPF [133] (collaboration avec ICMCB (Bordeaux) et SOLEIL (Saclay)). Nous avons également mis au point une technique de clustering basée sur la factorisation de matrices non-négatives (NMF), appliquée aux cathodes LMNO [43] (collaboration avec NanoMegas (Belgique)). Notre équipe a finalement développé une méthode pour analyser et réduire le bruit dans les motifs de diffraction électronique des données 4D-STEM [43] (collaboration avec SIMAP (Grenoble), ICMCB (Bordeaux)).

Développement algorithmique en apprentissage profond (Deep Learning)

Depuis 2018, le LRCS a été à la pointe de l'innovation dans l'application des algorithmes d'apprentissage profond à l'analyse des matériaux de batteries, un domaine caractérisé par un volume de données considérable. Nous avons développé des flux de travail algorithmiques dédiés, incorporant des méthodes d'apprentissage automatique et semi-automatique, notamment en utilisant des modèles de Deep Learning tels que les autoencodeurs variationnels (VAE), les réseaux Long Short Term Memory (LSTM) et les réseaux convolutionnels temporels (TCN). Ces modèles ont été spécifiquement adaptés pour répondre aux exigences structurelles de nos données et applications diverses pour la caractérisation des batteries.
Les données nécessaires à l'entraînement de ces modèles proviennent d'expériences innovantes telles que la tomographie par rayons X nano-synchrotron (nano-XCT), la microscopie électronique en transmission en 4 dimensions (4D-STEM), et les tests de cyclage électrochimique pour l'étude du vieillissement, ainsi que de simulations numériques de champ de phase pour analyser les réactions de lithiation. Nous avons non seulement optimisé les phases d'entraînement, mais également intégré des stratégies de fine-tuning à l'aide d'algorithmes pré-entraînés pour généraliser l'efficacité des approches basées sur le Deep Learning. La figure 2 met en lumière les avancées significatives réalisées par notre équipe dans l'analyse des matériaux pour batteries. Premièrement, nous avons développé SegmentPy, un logiciel innovant conçu spécifiquement pour la segmentation d'images tomographiques 3D à rayons X (XCT). Ce logiciel est doté de fonctionnalités avancées permettant une optimisation efficace des hyperparamètres, facilitant ainsi le traitement et l'analyse des données complexes [123] (collaboration avec Mines ParisTech (Paris) et APS (USA)). Nous avons ensuite conçu un algorithme d'auto-encodeur variationnel dédié (VAE), pour accélérer substantiellement l'analyse des données issues de simulations de champ de phase. Cet outil est crucial pour comprendre la dynamique de lithiation dans les matériaux de batteries, offrant ainsi une compréhension plus profonde des processus internes [4] (collaboration avec Aachen Université (Allemagne)). Enfin, nous avons mis au point un algorithme de décision dédié à l'évaluation automatique de la segmentabilité des images XCT [95]. Cette innovation permet une analyse plus rapide et plus précise, essentielle pour faciliter l’analyse 3D des matériaux pour batteries. Ces contributions ouvrent de nouvelles voies pour les recherches futures et renforcent notre position à la pointe de la science des données.
Perspectives
Afin de renforcer notre savoir-faire dans le traitement des données 4D-STEM, nous allons développer de nouveaux algorithmes pour l’évaluation des contraintes mécaniques à partir de l’analyse des patterns de diffraction 4D-STEM et pour l’amélioration des identifications des structures cristallines à partir des patterns simulés sur la base des fichiers CIF. Par ailleurs, le groupe va innover dans le domaine du deep-learning, en mettant au point des algorithmes spécifiques pour le traitement des données en série temporelle. Ces outils de deep-learning vont également être adaptés aux données multimodales, qui intègrent diverses techniques de caractérisation, permettant ainsi une analyse plus complète et précise des matériaux de batteries.