Skip to Main content
Number of documents

6

Thibault Clérice


Points d'intérêt

  • Analyse computationnelle du latin classique et tardif
  • Apprentissage profond et chaînes de numérisation de textes
  • Standards et méthodes de partage des données
  • Ingénierie pour les sciences humaines: bonnes pratiques, contrôle qualité

Diplômes

En cours: Thèse, Dire la sexualité en latin classique et tardif : une étude lexicographique par « apprentissage profond »,  sous la direction de Christian Nicolas à l'université de Lyon 3

Master "Technologies Numériques Appliquées à l'Histoire", École des Chartes et King's College of London

Licence Lettres Classiques, Sorbonne

Activités professionnelles

2017-Aujourd'hui Responsable pédagogique du master Technologies Numériques Appliquées à l’Histoire à l’École Nationale des Chartes
2014-2017 Wissenschaftlicher Mitarbeiter à l'université de Leipzig. Ingénieur principal pour l'infrastructure de Perseus 5 et Capitains.org
2014-2017 Enseignant vacataire à l'École Nationale des Chartes (Python, JavaScript, HTML5)
2014-2017 Freelance pour Syriaca.org et Perseids.org
2015 Enseignant à l’université d’été, « “Culture & Technology” - The European Summer University in Digital Humanities », du 28 juillet au 7 août, université de Leipzig, Allemagne.
2013-2014 Research developer, Centre for e-Research, Digital Humanities Department, King's College London. Projet EHRI (portal.ehri.eu) et DASISH
2006-2013 Développeur en freelance

Bourses et Prix

2019 Prix Paul Fortier, Conférence DH2019 Utrecht, pour l'article "Stylometry for Noisy Medieval Data: Evaluating Paul Meyer's Hagiographic Hypothesis." avec Ariane Pinche et Jean-Baptiste Camps
2013-2014 Bourse pour la Goettingen’s Summer School “DARIAH-DE International Digital Humanities Summer School”
2013 Bourse “Soutien aux acteurs de la recherche en humanités numériques” pour DH2014

Responsabilités

2016-

Eurykleia – https://eurykleia.hypotheses.org

Base de données en ligne sur les femmes de l’Antiquité grecque et latine depuis le VIIIe siècle avant notre ère jusqu’au Ve siècle de notre ère. Conseils technologiques et support pédagogique

2016-
Distributed Text Services – https://w3id.org/dts
Technical Committee member, Funding Member
2014- Open Greek And Latin
2016- First One Thousand Years of Greek
2015
Visible Words / Mots Visibles
Coopération transatlantique combinant recherche et formation en épigraphie. Déplacement sur le terrain en 2015 à Thasos (Grèce). Conseils technologiques et support pédagogique
2014- Alpheios – http://alpheios.net/Conseil.

Membre de l’advisory board du projet « morphlib » sponsorisé par la Digital Latin Library.
2014- CapiTainS – https://capitains.org
Ensemble de normes pour l’encodage de textes ainsi que des suites logicielles. Responsable de la norme et de la plupart des logiciels. CapiTainS permet le partage de nœuds textuels et leur représentation dans des bibliothèques numériques via des standards TEI et Linked Data.
2014- Perseus – http://scaife.perseus.org
Conseil pour l’architecture logicielle, les standards et les interfaces. Responsable des nouveaux formats de numérisation
2013-2014 European Holocaust Research Infrastructure (EHRI)
Développement du portail, des outils et des standards (Scala, Javascript, XML, Solr, Neo4J) pour une centralisation des fiches d’archives de plus de 80 institutions. Participation avec les archives de Prague dans la planification de l’outil de valorisation narratif du patrimoine archivistique.
2013-2014 TERESAH, DASISH (KCL)
Responsable de l’équipe de développement, de la conception des vocabulaires et du minage de données. Interface normative pour la réalisation de portefeuilles d’outils décrits et accompagnés.

2013
Cerch Spring Seminars

 

 


Simon Gabay   

Journal articles1 document

  • Jean-Baptiste Camps, Simon Gabay, Paul Fièvre, Thibault Clérice, Florian Cafiero. Corpus and Models for Lemmatisation and POS-tagging of Classical French Theatre. Journal of Data Mining and Digital Humanities, Episciences.org, 2021, ⟨10.46298/jdmdh.6485⟩. ⟨halshs-02591388v2⟩

Conference papers3 documents

  • Thibault Clérice, Matthias Gille Levenson, Lucence Ing, Ariane Pinche, Simon Gabay, et al.. Lemmatiser des textes et corriger l'annotation grâcè a l'apprentissage profond avec Pyrrha. Humanistica 2021, May 2021, Rennes, France. ⟨hal-03224112⟩
  • Anna Scius Bertrand, Simon Gabay, Ljudmila Petkovic, Juliette Janes, Caroline Corbières, et al.. The BIR database – Identifying typographic emphasis in list-like historical documents. HIP@ICDAR21 - The 6th International Workshop on Historical Document Imaging and Processing, Sep 2021, Lausanne, Switzerland. ⟨10.1145/3476887.3476913⟩. ⟨hal-03355683⟩
  • Simon Gabay, Thibault Clérice, Jean-Baptiste Camps, Jean-Baptiste Tanguy, Matthias Gille-Levenson. Standardizing linguistic data: method and tools for annotating (pre-orthographic) French. Proceedings of the 2nd International Digital Tools & Uses Congress (DTUC '20), Oct 2020, Hammamet, Tunisia. ⟨10.1145/3423603.3423996⟩. ⟨hal-03018381⟩

Other publications1 document

  • Simon Gabay, Jean-Baptiste Camps, Thibault Clérice. Manuel d'annotation linguistique pour le français moderne (XVIe -XVIIIe siècles). 2020. ⟨hal-02571190⟩

Preprints, Working Papers, ...1 document

  • Simon Gabay, Thibault Clérice, Christian Reul. OCR17: Ground Truth and Models for 17th c. French Prints (and hopefully more). 2020. ⟨hal-02577236⟩