Un des principaux axes de recherche d'IFPEN porte sur les procédés et les catalyseurs destinés à la production de carburants biosourcés. Ceci se traduit par de nombreux travaux expérimentaux dont les résultats génèrent de la connaissance capitalisée sous forme de modèles. Cependant, cette modélisation nécessite l’acquisition de nombreuses données expérimentales, ce qui est coûteux en temps et en moyens.
Historiquement, IFPEN a construit une grande base de données expérimentales et développé des modèles cinétiques visant à prédire l’activité catalytique pour la transformation de charges hydrocarbures fossiles. Dans une logique de valorisation de ces connaissances depuis la pétrochimie vers la chimie biosourcée, une première thèse a été consacrée à l’apprentissage par transfert de connaissance, dit « transfert learning », par une approche bayésienne1 permettant d’identifier les nouveaux paramètres de modèles existants [1]. Une deuxième thèse [2], en cours, aborde d’autres méthodologies de transfert d’apprentissage, issues de développement récents en science des données : son objectif est d’accélérer le développement de modèles cinétiques pour des nouvelles générations de catalyseurs adaptés aux nouvelles charges biosourcées.
1 Méthode d'inférence statistique par laquelle on calcule les probabilités de diverses causes hypothétiques à partir de l'observation d'événements connus
Deux approches sont étudiées : model-based et data-based. La première approche est basée sur un modèle existant et le transfert d’apprentissage inclut la structure de ce modèle, l’apprentissage se faisant alors sur les nouvelles données. La seconde approche combine de nouvelles données (charges biosourcées) avec d’anciennes données (charges d’origine fossile) pour réaliser des prédictions sur le nouveau domaine.
Pour ces deux approches, à qualité de prédiction équivalente, le nombre de nouvelles données nécessaires pour l’apprentissage du nouveau modèle s’est avéré moindre par rapport à la méthodologie sans transfert.
Nous avons appliqué les deux méthodologies sur des données synthétiques2 créées à partir des modèles cinétiques de désazotation développées à IFPEN pour le procédé d’hydrocraquage. Les résultats présentés sur la Figure 1 correspondent aux prédictions réalisées sur la base cible (target) en fonction du nombre de points utilisés. La qualité du modèle est évaluée en calculant l’erreur moyenne absolue3 de la teneur en azote sur 20 simulations indépendantes.
2 Données obtenues par calcul, représentatives de la réalité terrain (par exemple : température de réaction, pression, composition en azote en entrée et sortie). Environ 50 000 points simulés.
3 Mean absolute error sur la figure 1 : représente la différence entre les valeurs expérimentales et les valeurs simulées.
Le cas sans transfert (without transfer), utilisé comme référence, correspond à la précision que nous pouvons obtenir si un nouveau modèle est développé uniquement sur la base cible. La qualité du modèle obtenu n’est pas satisfaisante, même si 25 points sont utilisés. Quand le transfert learning est utilisé (data based), l’erreur des prédictions est nettement réduite pour une taille d’échantillonnage similaire. De plus, si le transfert basé sur le modèle est utilisé (model-based), l’erreur moyenne des prédictions est encore divisée par deux. Ceci s’explique par l’ajout de connaissance sous la forme d’un modèle cinétique, ce qui n’est pas le cas sur la stratégie basée uniquement sur les données.
Ces travaux contribuent à définir une méthodologie qui exploite les connaissances acquises dans le « domaine fossile » afin d’optimiser le temps de développement des nouveaux procédés biosourcés, comme par exemple, le co-processing de huiles végétales.

Références :
- L. Iapteff, Apprentissage par transfert pour l’analyse prédictive intelligente, Thèse IFPEN, Université Lyon II, 2022
>> DOI : https://theses.fr/2022LYO20007
- Y. Abed, Transfert de modèles cinétiques d’hydroprocessing de charges fossiles à des charges NTE par Transfert Learning, Thèse en cours, Université de Lyon 1, Claude Bernard...
Contact scientifique : Victor Costa