Présentation
Ces rencontres ont pour objectif de présenter des résultats récents et des applications originales en classification sous toutes ses formes, mathématique, informatique et statistique, de favoriser les échanges scientifiques entre ces trois communautés autour de la thématique commune de la classification et de faire connaitre à divers partenaires extérieurs les travaux de ses membres.
Le thème des rencontres est la classification et l'analyse de données au sens large et, en particulier, ces thèmes classiques :
- Classification et discrimination
- Modèles de mélange
- Méta-heuristiques en classification
- Représentation et visualisation
- Analyse de données topologiques
- Analyse de données symboliques
- Arbres, graphes et treillis
- Applications de la classification dans tous les domaines
- Structures combinatoires pour la classification
- Sériation
- ...
Cette année, nous aurons une journée commune avec CAp (Conférence sur l'Apprentissage Automatique), consacrée aux applications de l'apprentissage automatique à la classification ou de la classification à l'apprentissage automatique, et plus généralement aux liens entre ces deux domaines.
Conférencier invité
Christian Hennig (Bologna), On decision making in cluster analysis
Résumé
There are many different approaches to cluster analysis, and when applied to the same data, different methods will pften produce quite different clusterings. Data analysts do not only have to choose a clustering method, also pre- and postprocessing decisions need to be made, such as selection and transformation of features and the number of clusters.
Making all the required decisions is very difficult. As there is no unique definition of the clustering problem, neither is there a unique or "optimal" way to measure the quality of a clustering, and the data alone do not hold all the information required to make these decisions. This is a big challenge for automatising cluster analysis for machine learning in particular.
I will discuss some of the required decisions and quality criteria, illustrating problems with automated decision making, and how background knowledge and techniques such as data visualisation can help.
Programme
Mercredi 02 Juin (Journée CAp-SFC)
Session CAp-SFC 1 (10H30—12H)
- 10H30 : Laetitia Chapel & Romain Tavenard, One for all and all for one: Efficient Computation of Partial Wasserstein Distances on the Line
- 11H : Noor Khalal, Abdallah Alaa-Eddine Djamai, Imed Keraghel & Mohamed Nadif, Vers un Clustering plus équilibré : Augmentation de Données par GMMs et LLMs
- 11H30 : Trung Anh Dang, Vincent Nguyen, Ngoc-Son Vu & Christel Vrain, Memory-efficient Continual Learning with Neural Collapse Contrastive
- 11H45 : Xavier Dupuis & Patrick Tardivel, The Solution Path of SLOPE
Session Invitée (15H30—16H30)
Nadjib Lazaar, Apprendre à modéliser : acquisition de contraintes par requêtes et hybridation symbolique–connexionniste
Résumé
Constraint Acquisition (CA) est un cadre d’apprentissage symbolique situé à l’intersection entre l’apprentissage de concepts (approche inductive) et la programmation par contraintes (démarche déductive). Ces deux paradigmes, issus de la tradition de l’intelligence artificielle symbolique, sont intégrés dans CA afin de faciliter et d’accélérer la phase de modélisation des problèmes en automatisant la construction de réseaux de contraintes décrivant un concept cible.
Dans le cadre de l’acquisition de contraintes par requêtes (Query-Based Constraint Acquisition, QBCA), l’apprenant interagit activement avec un oracle en posant des requêtes structurées, affinant ainsi l’espace des hypothèses. Cet exposé dressera un panorama structuré du cadre QBCA, en mettant particulièrement l’accent sur la typologie des requêtes (e.g., requêtes d’appartenance, d’équivalence) et leur rôle dans le processus d’acquisition. Nous aborderons également les fondements théoriques, les développements algorithmiques récents, et les extensions vers des contextes partiels, incertains ou qualitatifs. QBCA ouvre des perspectives prometteuses dans des applications telles que l’analyse de programmes, les systèmes autonomes, ou encore la modélisation interactive explicable dans l’XAI.
Enfin, nous discuterons des ponts émergents entre QBCA et les approches connexionnistes contemporaines, notamment via les modèles de langage (LLM) et les Transformers, avec des pistes pour combiner raisonnement symbolique explicite et puissance d’apprentissage statistique.
Session CAp-SFC 2 (17H—18H30)
- 17H : Amine Ferdjaoui, Séverine Affeldt & Mohamed Nadif, Vers une meilleure exploitation du clustering textuel : clustering pondéré et LLM
- 17H30 : Hajar Kamel, Hasna Chamlal & Tayeb Ouaderhman, Associative Feature-Driven Undersampling for Imbalanced Data Classification
- 18H : Rémi Kazmierczak, Eloïse Berthier, Gianni Franchi & Goran Frehse, CLIP-QDA: An Explainable Concept Bottleneck Model
- 18H15 : Nicolas Urbani, Sylvain Rousseau, Yves Grandvalet & Leonardo Tanzi, Exploiter les superclasses pour l'apprentissage à partir de bases de données hiérarchiques
Jeudi 03 Juin
Session SFC 1 (10H30—12H)
- Jang Schiltz & Cédric Noel, Multitrajectory Analysis in Finite Mixture Models
- Chourouk Elokri, Tayeb Ouaderhman & Chamlal Hasna, Kendall's tau and copula-based active learning algorithm
Session SFC 2 (15H—16H)
- Rafik Abdesselam, Une approche Topologique de l'Analyse Discriminante
- François Brucker & Pascal Préa, Problèmes de sériation dans les graphes
Assemblée Générale de la SFC (16H30—17H33)
Vendredi 04 Juin
Session SFC 3 (10H30—12H)
- Patrice Bertrand & Jean Diatta, Le critère d'Apresjan en classification hiérarchique ascendante
- Stéphanie Bougeard, Jean-Michel Gallaret & Mohamed Hanafi, Explorer les structures d'observations communes, partiellement communes et spécifiques à plusieurs blocs de variables
Invité (14H—15H)
Christian Hennig, On decision making in cluster analysis
Session SFC 4 (15H—16H)
- Yasmine Agliz, Vincent Audigier, Ndèye Niang & Mohamed Nadif, Étude de variabilité par bootstrap résiduel pour une méthode de subspace clustering
- Victor Chepoi, Guyslain Naves & Pascal Préa, Dissimilarités de Robinson multi-dimensionelles
Dates importantes
- Soumission des résumés : 28 février 2025
- Notifications aux auteurs : 15 avril 2025
- Conférence : 02--04 juillet 2025
- Journée CAp-SFC : 02 juillet 2025
Instructions aux auteurs
Comité de programme
Président
Pascal Préa, LIS (Laboratoire d'Informatique & des Systèmes),
École Centrale Méditerranée
Membres
- Rafik Abdesselam, Université Lumière Lyon
- Séverine Affeldt, Université de Paris
- Alexandre Bazin, LIRMM, Montpellier
- Patrice Bertrand, Université Paris Dauphine
- Paula Brito, Université de Porto, Portugal
- François Brucker, École Centrale Méditerranée
- Véronique Cariou, ONIRIS Nantes
- Christian Derquenne, EDF R&D
- Dominique Desbois, INRAE-Paris-Saclay
- Jean Diatta, Université de La Réunion
- Nadia Ghazalli, Université du Québec à Trois-Rivières, Canada
- Pascale Kuntz, Université de Nantes
- Lazhar Labiod, Université Paris Descartes
- Mustapha Lebbah, Université Paris 13
- Ahmed Moussa, ENSA Tanger, Maroc
- Mohamed Nadif, Université Paris Descartes
- Amedeo Napoli, LORIA, Nancy
- Ndèye Niang, CNAM Paris
- Allou Samé, Université Gustave Eiffel
- Rosanna Verde, Université della Campania, Caserta, Italie