Skip to Main content

Researcher identifiers

Social networks

    Export Publications

    Export the displayed publications:

    Keywords

    Number of documents

    7

    Lucas TERRIEL | CV


    Ingénieur recherche et développement INRIA-ALMAnaCH (Automatic Language Modelling and Analysis & Computational Humanities)

    ALMAnaCH  — Centre Inria de Paris

    2 rue Simone Iff, 75589 Paris Cedex 13 (France)

    Je suis ingénieur R&D au sein de l'équipe ALMAnaCH à INRIA ; je travaille dans le domaine du traitement automatique des langues (TAL) dans le contexte de la gestion, de l'enrichissement et de la valorisation des données patrimoniales ou des corpus en sciences humaines et sociales.
     
    Mes recherches et mes réalisations logicielles portent sur différentes thématiques, entre autres : 
     
    - cadre et métriques d'évaluation pour la reconnaissance automatique des écritures manuscrites (HTR/OCR);
     
    - tâches de reconnaissance et d'extraction d'entités nommées (named entity recognition) et liage à des bases de connaissances (entity linking) pour l'indexation/structuration (semi-)automatique de documents;
     
    - publication de données de recherche structurées (exemple TEI).

    Activités professionnelles

    Emplois

    Depuis novembre 2020 : ingénieur recherche et développement à Inria, équipe-projet ALMAnaCH.

    - projet Ner4Archives (named entity recognition for archives - INRIA/Archives nationales)

    avril 2019 : vacataire TEKLIA, Annotation/segmentation de livres d'heures du bas Moyen-Âge sur le logiciel Transkribus dans le cadre du projet de recherche HORAE (IRHT-CNRS).

    Stages

    Avril 2020 à  juillet 2020 : ingénieur de recherche et de développement junior de l'équipe ALMAnaCH d'Inria sur le projet Lectaurep (réflexions sur un format pivot XML TEI pour centraliser les métadonnées et dévelloppement d'une application Python de visualisation des résultats de modèles HTR - KrakenBenchmark).

    Juillet 2019 à septembre 2019 : e-archiviste stagiaire à la mission des archives du ministère de la culture (Réflexions sur l'archivage des données nativement numériques au sein de la mission, tests sur les logiciels d'archivage numérique (Archifiltre, ReSIP, Octave, Vitam, ADAMANT) et priorisation des fonctionnalités au sein d'un product backlog pour des développements ultérieurs, rédaction de la documentation pour effectuer des versements électroniques à partir des outils existants pour traiter la messagerie, la bureautique et leurs métadonnées associées).

    Juin 2019 : archiviste stagiaire au Minutier central des notaires parisiens des Archives nationales (analyse des minutes et inventaire de l'étude XLVI et de l'étude VII, traitement matériel et intellectuel d'un vrac d'archives privés de l'étude XVII)

    Cursus universitaire

    2018-2020 : Master « Technologies numériques appliquées à l’histoire »,  École nationale des chartes-PSL.

    2016-2018 : Master recherche en histoire, civilisations, patrimoine des mondes contemporains, Université de Cergy-Pontoise/UQAM (Canada).

    2013-2016 : Classes préparatoires littéraires, Lycée Gustave-Monod, Enghein-les-Bains.

    Activités scientifiques

    Développements / Humanités numériques

    - KaMI (Kraken as Model Inspector - ex Kraken-Benchmark) : Écosystème agnostique pour l'évaluation de modèles HTR/OCR comprenant une librarie en Python (Kami-lib) et une application (Kami-app) ; originellement basé sur moteur Kraken.

    Kraken-Benchmark (archivé) : Dashboard de métriques pour évaluer les modèles HTR/OCR en Python et utilisation du moteur OCR/HTR Kraken via son API

    Open Barzaz Breiz Collection (réalisation de Master) : Application web Python-Flask / XSLT / XML TEI de mise à disposition d'une collection de chants populaires bretons issus de l'ouvrage Barzaz Breiz (1846) de Théodore Hersart de La Villemarqué. 

    Travaux universitaires

    Représenter et évaluer les données issues du traitement automatique d'un corpus de documents historiques. L'exemple de la reconnaissance des écritures manuscrites dans les répertoires de notaires du projet LectAuRep, 2020, mémoire sous la direction d'Alix Chagué et Thibault Clérice, École nationale des chartes-PSL

     « Vive le Québec libre ! » et Charles de Gaulle en 1967 à travers les caricatures politique, 2018, mémoire sous la direction du Pr. Patrick Garcia, Université de Cergy-Pontoise

    Jean-Noël Jeanneney. historien civique, 2017, mémoire sous la direction du Pr. Patrick Garcia, Université de Cergy-Pontoise

    Traductions

    Fred Gibbs, «Installation de bibliothèques Python avec pip» traduction par Lucas Terriel, The Programming Historian en français 3 (2021), https://doi.org/10.46430/phfr0015.


    Poster communications1 document

    • Alix Chagué, Lucas Terriel, Laurent Romary. Des images au texte : LECTAUREP, un projet de reconnaissance automatique d'écriture. DHNord2020: The Measurement of Images: Computational Approaches in the History and Theory of the Arts, Nov 2020, Lille / Virtual, France. ⟨hal-03008579⟩

    Other publications1 document

    • Lucas Terriel. Le saviez-vous ? Les répertoires de notaires ne sont pas seulement des images numérisées !. 2020. ⟨hal-03138879⟩

    Conference papers5 documents

    • Florence Clavaud, Laurent Romary, Pauline Charbonnier, Lucas Terriel, Gaetano Piraino, et al.. NER4Archives (named entity recognition for archives) : Conception et réalisation d’un outil de détection, de classification et de résolution des entités nommées dans les instruments de recherche archivistiques encodés en XML/EAD.. Atelier Culture-INRIA, Ministère de la Culture; Inria; Archives nationales, Mar 2022, Pierrefitte sur Seine, France. ⟨hal-03625734⟩
    • Alix Chagué, Hugo Scheithauer, Lucas Terriel, Floriane Chiffoleau, Yves Tadjo-Takianpi. Take a sip of TEI and relax: a proposition for an end-to-end workflow to enrich and publish data created with automatic text recognition. Digital Humanities 2022 : Responding to Asian Diversity, ADHO; University of Tokyo, Jul 2022, Tokyo, Japan. ⟨hal-03739767⟩
    • Lucas Terriel. Atelier : Production d'un modèle affiné de reconnaissance d'écriture manuscrite avec eScriptorium et évaluation de ses performances. Évaluer son modèle HTR/OCR avec KaMI (Kraken as Model Inspector). Les Futurs Fantastiques - 3e Conférence Internationale sur l’Intelligence Artificielle appliquée aux Bibliothèques, Archives et Musées, AI4LAM; Bibliothèque nationale de France, Dec 2021, Paris, France. ⟨hal-03495762⟩
    • Hugo Scheithauer, Alix Chagué, Aurélia Rostaing, Lucas Terriel, Laurent Romary, et al.. Production d'un modèle affiné de reconnaissance d'écriture manuscrite avec eScriptorium et évaluation de ses performances. Les Futurs Fantastiques - 3e Conférence Internationale sur l’Intelligence Artificielle appliquée aux Bibliothèques, Archives et Musées, AI4LAM, Bibliothèque nationale de France, Dec 2021, Paris, France. ⟨hal-03538195⟩
    • Pauline Charbonnier, Lucas Terriel, Florence Clavaud, Laurent Romary, Gaetano Piraino, et al.. NER4Archives (named entity recognition for archives) : méthodes et outils semi-automatiques pour reconnaître les entités nommées dans les instruments de recherche archivistiques encodés en XML/EAD. Les Futurs Fantastiques - 3e Conférence Internationale sur l’Intelligence Artificielle appliquée aux Bibliothèques, Archives et Musées, AI4LAM; Bibliothèque nationale de France, Dec 2021, Paris, France. ⟨hal-03495486⟩