Skip to Main content
New interface
Number of documents

1

Lucas TERRIEL | CV


Ingénieur recherche et développement INRIA-ALMAnaCH (Automatic Language Modelling and Analysis & Computational Humanities)

ALMAnaCH  — Centre Inria de Paris

2 rue Simone Iff, 75589 Paris Cedex 13 (France)

Je suis ingénieur R&D au sein de l'équipe ALMAnaCH à INRIA ; je travaille dans le domaine du traitement automatique des langues (TAL) dans le contexte de la gestion, de l'enrichissement et de la valorisation des données patrimoniales ou des corpus en sciences humaines et sociales.
 
Mes recherches et mes réalisations logicielles portent sur différentes thématiques, entre autres : 
 
- cadre et métriques d'évaluation pour la reconnaissance automatique des écritures manuscrites (HTR/OCR);
 
- tâches de reconnaissance et d'extraction d'entités nommées (named entity recognition) et liage à des bases de connaissances (entity linking) pour l'indexation/structuration (semi-)automatique de documents;
 
- publication de données de recherche structurées (exemple TEI).

Activités professionnelles

Emplois

Depuis novembre 2020 : ingénieur recherche et développement à Inria, équipe-projet ALMAnaCH.

- projet Ner4Archives (named entity recognition for archives - INRIA/Archives nationales)

avril 2019 : vacataire TEKLIA, Annotation/segmentation de livres d'heures du bas Moyen-Âge sur le logiciel Transkribus dans le cadre du projet de recherche HORAE (IRHT-CNRS).

Stages

Avril 2020 à  juillet 2020 : ingénieur de recherche et de développement junior de l'équipe ALMAnaCH d'Inria sur le projet Lectaurep (réflexions sur un format pivot XML TEI pour centraliser les métadonnées et dévelloppement d'une application Python de visualisation des résultats de modèles HTR - KrakenBenchmark).

Juillet 2019 à septembre 2019 : e-archiviste stagiaire à la mission des archives du ministère de la culture (Réflexions sur l'archivage des données nativement numériques au sein de la mission, tests sur les logiciels d'archivage numérique (Archifiltre, ReSIP, Octave, Vitam, ADAMANT) et priorisation des fonctionnalités au sein d'un product backlog pour des développements ultérieurs, rédaction de la documentation pour effectuer des versements électroniques à partir des outils existants pour traiter la messagerie, la bureautique et leurs métadonnées associées).

Juin 2019 : archiviste stagiaire au Minutier central des notaires parisiens des Archives nationales (analyse des minutes et inventaire de l'étude XLVI et de l'étude VII, traitement matériel et intellectuel d'un vrac d'archives privés de l'étude XVII)

Cursus universitaire

2018-2020 : Master « Technologies numériques appliquées à l’histoire »,  École nationale des chartes-PSL.

2016-2018 : Master recherche en histoire, civilisations, patrimoine des mondes contemporains, Université de Cergy-Pontoise/UQAM (Canada).

2013-2016 : Classes préparatoires littéraires, Lycée Gustave-Monod, Enghein-les-Bains.

Activités scientifiques

Développements / Humanités numériques

- KaMI (Kraken as Model Inspector - ex Kraken-Benchmark) : Écosystème agnostique pour l'évaluation de modèles HTR/OCR comprenant une librarie en Python (Kami-lib) et une application (Kami-app) ; originellement basé sur moteur Kraken.

Kraken-Benchmark (archivé) : Dashboard de métriques pour évaluer les modèles HTR/OCR en Python et utilisation du moteur OCR/HTR Kraken via son API

Open Barzaz Breiz Collection (réalisation de Master) : Application web Python-Flask / XSLT / XML TEI de mise à disposition d'une collection de chants populaires bretons issus de l'ouvrage Barzaz Breiz (1846) de Théodore Hersart de La Villemarqué. 

Travaux universitaires

Représenter et évaluer les données issues du traitement automatique d'un corpus de documents historiques. L'exemple de la reconnaissance des écritures manuscrites dans les répertoires de notaires du projet LectAuRep, 2020, mémoire sous la direction d'Alix Chagué et Thibault Clérice, École nationale des chartes-PSL

 « Vive le Québec libre ! » et Charles de Gaulle en 1967 à travers les caricatures politique, 2018, mémoire sous la direction du Pr. Patrick Garcia, Université de Cergy-Pontoise

Jean-Noël Jeanneney. historien civique, 2017, mémoire sous la direction du Pr. Patrick Garcia, Université de Cergy-Pontoise

Traductions

Fred Gibbs, «Installation de bibliothèques Python avec pip» traduction par Lucas Terriel, The Programming Historian en français 3 (2021), https://doi.org/10.46430/phfr0015.


Hugo Scheithauer    Marc Durand   

Conference papers1 document

  • Hugo Scheithauer, Alix Chagué, Aurélia Rostaing, Lucas Terriel, Laurent Romary, et al.. Production d'un modèle affiné de reconnaissance d'écriture manuscrite avec eScriptorium et évaluation de ses performances. Les Futurs Fantastiques - 3e Conférence Internationale sur l’Intelligence Artificielle appliquée aux Bibliothèques, Archives et Musées, AI4LAM, Bibliothèque nationale de France, Dec 2021, Paris, France. ⟨hal-03538195⟩