Le Laboratoire Informatique Image et Interaction (L3i, La Rochelle Université) est reconnu pour son expérience et son expertise en analyse de documents patrimoniaux en s’appuyant sur des approches textuelles et visuelles. Il a notamment été leader ou a pris part à différents projets financés par l’Europe (H2020 NewsEye ; H2020 EMBEDDIA) ou l’ANR (Navidomass, CHAMDOC, …) et a développé l’approche état de l’art en reconnaissance d’entités nommées historiques. Il pilote l’ensemble du projet (WP1), et la partie jumelage / désambiguïsation des données (WP4).
L’équipe du L3i sera coordonnée par Mickaël COUSTATY (MCF informatique), informaticien spécialiste
du traitement automatique de documents (WP3) reconnu à l’internationale sur sa thématique (Young
Investigator Award 2021). Il a déjà coordonné plusieurs projets d’envergures (PIA, ANR, Européen) et
sera accompagné d’Antoine DOUCET (PR informatique) qui a coordoné le projet H2020 NewsEye sur
la presse ancienne européenne et spécialiste de l’analyse sémantique du texte (WP4); et d’Alain
BOUJU (MCF HDR informatique) spécialiste en optimisation des Systèmes d’Information
Géographique et sur la structuration des données complexes (WP5).
L’Institut national d’études démographiques (Ined) est un organisme français de recherche spécialisé dans les recherches en démographie et les études de population, dans une approche ouverte mobilisant un large éventail de disciplines, comme l’économie, la géographie, la sociologie, l’anthropologie, la biologie, l’épidémiologie, et l’histoire. Plusieurs travaux menés à l’Ined concernent des données nominatives anciennes, avec des reconstitutions de famille sur le temps long.
L’équipe de l’INED sera coordonnée par Isabelle SEGUY (historienne-démographe et paléodémographe), dont les thèmes de recherche portent sur les comportements démographiques des populations historiques à partir de ressources écrites ou matérielles, dans une approche holistique. Elle sera accompagnée par Thomas MERLY ALPA (chef du service des enquêtes et sondages de l’Ined) qui possède une expertise des questions relatives à l’échantillonnage et au redressement statistique des enquêtes ; par Arno MULLER sur la structuration et la visualisation des résultats ; par Arnaud BRINGÉ (responsable du Service Méthodes Statistiques) et Elodie BARIL (IE au service des méthodes statistiques) pour vérifier la cohérence des données et la mise en place d’analyse statistique (WP2 et WP5). Cette équipe est également complétée par des chercheurs émérites ou appartenant à des universités étrangères (et associés à l’Ined), en raison de leurs compétences très spécifiques, très pointues et nécessaires à la bonne exécution du projet (H. Caussinus, mathématicien – WP5 ; P. Darlu, généticien – WP 5 et 6 et A. Litvine, historien économiste – WP 2 et 6).
Le Centre Tourangeau d’Histoire et d’étude des Sources (CeTHiS, Université de Tours) est un laboratoire qui fait de l’édition et de la constitution de corpus historiques, ainsi que des méthodes de leur interprétation, l’un de ses trois axes de recherche majeurs. Pascal Chareille pilotera les enquêtes sur la Touraine et l’île de Ré, terrains sur lesquels il a déjà travaillé. L’équipe du CeTHiS sera coordonnée par Pascal CHAREILLE (MCF histoire médiévale), historien avec une formation universitaire initiale en mathématiques. Ses recherches portent sur l’histoire sociale et économique, l’anthroponymie dans la longue durée, et les méthodes quantitatives en histoire. Il a collaboré avec plusieurs partenaires impliqués dans ce projet pour des travaux sur la composition des corpus patronymiques, leur dynamique chronologique et la mobilité des personnes dans la longue durée.
Le Centre Roland Mousnier (CRM, UMR 8596, CNRS, Sorbonne Université) est l’un des plus anciens centres de recherche français en histoire. Pilier de la démographie historique depuis son origine, avec des figures comme Pierre Chaunu, Jean-Pierre Bardet et Jean-Pierre Poussou, et hébergeant la Société de Démographie Historique et sa revue, les Annales de Démographie Historique, il a fait de l’histoire de la famille et des populations, une de ses priorités et le premier de ses six axes de recherche. Il héberge l’enquête « Charleville » depuis le projet ANR « Mobilités, Populations, Familles », obtenu en 2007 par François-Joseph Ruggiu, et prolongé, en 2018, par le projet Emergence « Connexions Carolopolitaines » (Sorbonne Université) dirigé par Vincent Gourdon.
L’équipe du CRM sera coordonnée par Vincent GOURDON (DR CNRS historien démographe), spécialiste d’histoire de la famille. Participant à l’enquête Charleville depuis son lancement (ANR « Mobilités, Populations, Familles » en 2007), il sera accompagné d’Isabelle ROBIN (MCF HDR Sorbonne Université) spécialiste d’histoire sociale et de la famille pour les opérations d’élaboration des ontologies ; de François-Joseph RUGGIU (PU Sorbonne Université) spécialiste d’histoire sociale, il apportera sa connaissance approfondie aux opérations de jumelage ainsi qu’à la construction des ontologies ; de Doriane HARE (IE CNRS) spécialiste en production, traitement et analyse de données, elle participera à la structuration des données de démographie historique.
La société Geneanet est une société créé par des passionnés de généalogie en 1996, comptant une communauté de plus de 5 millions de membres, et qui édite un site internet dédié à la généalogie, proposant une base de données (8 milliards d’individus au 01/01/2023) alimentée à la fois par les
utilisateurs du site et via des projets d’indexation systématique. Via son site collaboratif et contributif, Geneanet réalise l’indexation de documents nominatifs, reconstitue ou améliore des arbres généalogiques et met à disposition de très nombreux fonds d’archives, ouvrages numérisés et autres documents anciens, afin d’aider les utilisateurs à retracer leurs histoires familiales. Geneanet aura en charge la dissémination (WP6) du projet via la mise à disposition de données généalogique nécessaire au projet ; apportera son expertise en traitement des données généalogiques et les résultats de ce projet permettront de faire évoluer ses algorithmes de de recherche automatisées.
L’équipe de Geneanet sera coordonnée par Jérôme GALICHON (responsable R&D&I), il participera en tant qu’expert en traitement de données généalogiques. Il sera secondé par l‘équipe de Geneanet en charge des projets d’indexation.
La société TEKLIA est un éditeur de logiciels français développant des solutions de compréhension automatique de documents numérisés. Elle a une grande expérience dans le développement de la reconnaissance automatique de documents manuscrits et imprimés, pour des institutions publiques patrimoniales, culturelles et de recherche (Archives Nationales, Bibliothèque de Norvège, UQAC-Canada, Archives des Pays-Bas). Teklia assurera la responsabilité du WP3 pour l’extraction de structure et la reconnaissance d’écritures manuscrites anciennes). L’équipe de Teklia est coordonnée par Christopher KERMORVANT (président), il participera en tant qu’expert en traitement automatique de documents par Deep Learning. Il sera accompagné de Solène TARRIDE (docteure en Informatique), spécialisée en reconnaissance d’écriture manuscrite par Deep Learning, qui co-encadrera le doctorant.