Apprentissage et Représentation des Connaissances

Membres du thème

NOM Prénom Statut
AIT EL MEKKI Touria Maître de conférences
AMGHAR Tassadit Maître de conférences/HDR
DA MOTA Benoit Maître de conférences
DUVAL Béatrice Professeur émérite
GENEST David Maître de conférences
GOUDET Olivier Maître de conférences
GUTOWSKI Nicolas Maître de conférences
HU Olivier Maître de conférences
LAMPRIER Sylvain Professeur
LOISEAU Stéphane Professeur
MACE Maxime Doctorant
MAHMOUDI Sid Ali ATER
NINI Brahim ATER
OZER Derin Doctorant
PETITBOIS Mathieu Doctorant
PINSOLLE Jean Doctorant

Le thème “Apprentissage et Représentations des Connaissances” (ARC) du LERIA se concentre sur des recherches en intelligence artificielle, couvrant à la fois des approches statistiques et symboliques, pour l’analyse, le traitement, l’interrogation et l’optimisation de données sémantiques complexes. 

Nos travaux se structurent en 3 axes :

  1. Apprentissage de Représentation et Méthodes Prédictives : Ce premier axe de recherche vise à développer des techniques d’apprentissage automatique pour extraire des représentations sémantiques à partir de données structurées ou non structurées, telles que du texte ou des graphes, et établir des modèles prédictifs efficaces pour diverses tâches applicatives (e.g., systèmes de recommandation, classification / régression inductive, désentrelacement de signaux, question-answering, recherche d’information). L’accent est mis sur l’exploration de modèles profonds pour la prise en compte de dépendances complexes dans les données, avec analyse de leurs capacités, la fusion de données hétérogènes, la recherche de représentations sémantiques compactes, le passage à l’échelle, l’accès à l’information avec contraintes de budget, et l’interprétabilité des résultats. Les travaux développés dans cet axe ont également trait à l’inférence bayésienne, l’inférence causale, et l’apprentissage éthique.  
  2. Génération, Exploration et Optimisation : Ce deuxième axe de recherche explore les méthodes de génération automatique de données et la recherche de politiques décisionnelles efficaces, pour divers domaines applicatifs, mettant en jeu principalement des séquences d’actions à échantillonner de manière  probabiliste. Les chercheurs travaillent sur des problématiques telles que la génération de textes, de séquences musicales, de structures graphiques (e.g., molécules), ou encore de séquences d’actions dans des environnements dynamiques (e.g., politiques de navigation / contrôle d’agents). Nous utilisons des méthodes comme les modèles auto-régressifs (e.g., réseaux récurrents, réseaux Transformers), des réseaux antagonistes génératifs (GANs), l’apprentissage par renforcement (RL) et l’apprentissage par imitation pour générer des données (ou comportements) réalistes, contrôlables et diversifiées. Parallèlement, nous investiguons des méthodes d’optimisation progressives (curriculum learning) pour la découverte de politiques décisionnelles efficaces dans des environnements complexes (potentiellement dynamiques). Divers travaux sont en connexion avec le thème MOC, pour l’établissement des méthodes d’exploration pour problèmes combinatoires via apprentissage statistique : apprentissage d’opérateurs de recherche locale, émergence de stratégies d’exploration, exploration probabiliste dans des représentations continues apprises (projet ANR COMBO), planification (e.g., MCTS, Alpha-zero) via itérations de politiques basées sur des modèles (e.g., applications à la rétrosynthèse et la découverte de structures en chimie moléculaire – projet G-GENOCOD).  
  3. Organisation Symbolique et Interrogation : Enfin, un troisième axe de recherche se concentre sur la représentation et le traitement des connaissances sous des formes symboliques, incluant les cartes cognitives, l’induction logique et les graphes conceptuels. Les chercheurs explorent des méthodes d’organisation efficaces pour les connaissances extraites des données, et développent des techniques d’interrogation permettant d’inférer des informations pertinentes à partir de bases de connaissances. Certains travaux, s’appuyant pour partie sur les autres axes du thème (e.g., NLP statistique) mais avec des objectifs plus focalisés sur l’interprétabilité des décisions, visent à extraire des règles d’implication logique pour la mise en place d’interactions avec des usagers (e.g., développement d’un chatbot interprétable pour la gestion des arrêts maladie, en collaboration avec la CPAM). Cet axe développe de forts liens avec le thème RIC, notamment pour des aspects en programmation par contraintes (e.g., problèmes de modélisation de contraintes d’emploi du temps, applications  en mobilité durable).