Cette journée thématique “Humanités Numériques et IA” est organisée avec le soutien de l’AFIA et de l’action des Sources aux Données Historiques en Humanités Numériques du GdR MADICS dans le cadre de la Plate-Forme Intelligence Artificielle (PFIA) qui aura lieu du 30 juin au 4 juillet 2024 à Dijon. La journée se tiendra le vendredi 4 juillet 2025.
Le vocable humanités numériques s’est aujourd’hui imposé pour désigner les travaux de recherche relevant tantôt : de la création, la gestion et la mise en œuvre de jeux de données numériques dans les domaines des sciences humaines et sociales ; de la modélisation et la formalisation de processus sociaux à l’aide d’outils mathématiques et informatiques ; ou de l’analyse des usages et des communautés numériques du point de vue des sciences humaines et sociales [1]. La journée “Humanités Numériques et IA” a pour but de faire un point sur les usages de l’intelligence artificielle dans le domaine des humanités numériques. Elle fait suite à une première journée organisée en 2024 sous l’égide de l’AFIA et des GdR MADICS et MAGIS, qui s’est concentrée sur les défis posés par les humanités numériques aux approches développées en intelligence artificielle.
Pour cette deuxième édition, nous recherchons des contributions portant sur le lien entre les sources de connaissances mobilisées par les chercheurs en sciences humaines et sociales et les données produites, manuellement ou automatiquement, à partir de ces sources pour servir de support à leurs analyses. Il peut s’agir de sources numériques ou non, de différentes natures : documents d’archives textuels ou iconographiques, formulaires d’enquêtes, relevés de capteurs, données du Web (réseaux sociaux, données participatives, etc.), données structurées de la recherche, etc. Leur traitement pour produire des données exploitables et diffusables peut présenter diverses difficultés: données non structurées, sous contraintes de droits d’auteur, nominatives, langues anciennes, rares, peu dotées, etc. Leur résolution impose des choix de transcription, de structuration, d’annotation, d’anonymisation, etc. qu’il convient de documenter afin de permettre aux futurs utilisateurs des données produites de prendre en compte les limites d’utilisation inhérentes aux choix effectués et aux traitement appliqués aux sources.
Nous sommes donc particulièrement intéressés par les propositions qui mettront en avant des approches relevant de l’intelligence artificielle et prenant en compte les questions suivantes:
La journée s’adresse aussi bien aux jeunes chercheurs qu’aux chercheurs plus expérimentés ainsi qu’aux industriels, à la fois dans les domaines des sciences humaines et sociales, des humanités numériques et de l’intelligence artificielle. Elle est ouverte à la présentation de travaux à différents stades d’avancement.
En ouverture de la journée thématique Humanités Numériques et IA, nous vous proposons d'assister à la présentation invitée de la conférence d'Ingénierie des Connaissances, qui sera donnée par Marieke van Erp (KNAW Humanities Cluster): Layering Knowledge to Unpack the Layers of Meaning in Historical Texts.
10h30-11h00 : PeGazUs : une méthode de reconstitution de l’évolution des entités géographiques à partir de données hétérogènes et fragmentaires. Charly Bernard, Nathalie Abadie, Bertrand Duménieu et Julien Perret.
11h00-11h20 : Développement d’une ontologie pour l'analyse de textes de décisions administratives d’Ancien Régime par des Grands Modèles de Langage. Gilles Falquet, Christophe Chazalon, Marco Sorbi, Stéphane Marchand-Maillet et Laurent Moccozet.
11h20-11h50 : Extraction et interprétation sémantique de tables anciennes : défis et perspectives. Solenn Tual, Nathalie Abadie, Joseph Chazalon, Bertrand Duménieu et Julien Perret.
14h00-14h20 : Repenser les collections patrimoniales par le prisme de l'IA. Marion Charpier et Emmanuelle Bermès.
14h20-14h40 : Amélioration de la segmentation de scènes par l’exploitation de relations spatiales : application aux sceaux byzantins. Ege Şendoğan, Victoria Eyharabide et Isabelle Bloch.
14h40-15h00 : Harold: un système de requête itératif et interactif pour l'exploration de corpus de patrimoine culturel. Prunelle Daudré-Treuil, Olivier Bruneau, Jean Lieber, Emmanuel Nauer et Laurent Rollet.
15h00-15h20 : Quand les humanités numériques rencontrent l’IA : une enquête sur la propriété à Paris. Aaron Parmentelat.
15h20-15h40 : Evaluation automatique du retour à la source dans un contexte historique long et bruité : les débats parlementaires de la Troisième République française. Aurélien Pellet, Julien Perez et Marie Puren.
15h40-16h00 : Synthèse des présentations autour des enjeux de traçabilité des données pour les Humanités numériques.
Dans la mesure où la langue officielle de la conférence est le français, les articles devront prioritairement être soumis en français. Les soumissions d’articles en anglais sont toutefois possibles, mais il faudra traduire le texte en français pour la version finale, en cas d’acceptation.
Les soumissions devront porter sur un ou plusieurs des thèmes ci-dessous, en mettant l’accent sur le lien entre sources et données. La liste proposée n'est toutefois pas exhaustive.
Nous acceptons un format unique d’articles comportant 4 à 6 pages. Chaque soumission fera l’objet d’une évaluation par plusieurs membres du comité de programme. Les articles sélectionnés donneront lieu à des présentations orales (en français sauf impossibilité majeure).
Les actes de la journée seront regroupés dans un document pdf publié en ligne.
Les articles doivent respecter le style PFIA 2025 et être soumis au format PDF via EasyChair.
Pour tout problème ou question en lien avec les soumissions et les relectures merci de contacter les président.e.s du comité de programme par le biais de la plateforme easychair : hnia2025@easychair.org
[1] Camille Roth. Digital, digitized, and numerical humanities. Digital Scholarship in the Humanities, 2019, 34 (3), pp.616-632.
[2] Principes FAIR