Simon Gabay
84
Documents
Identifiants chercheurs
- simon-gabay
- 0000-0001-9094-4475
- VIAF : 305833240
- ISNI : 0000000419576448
Présentation
Domaines de recherche
---------------------
Philologie numérique, humanités numériques
Histoire du théâtre
Philologie, paléographie, codicologie, ecdotique
Histoire de la philologie
Manuscrits et imprimés du XVIIe s. français
Formation
---------
2004-2006 Licence (Lettres modernes) - Paris IV-Sorbonne.
2006-2007 Licence in Integrated European Studies - University of Saint Andrews.
2007-2008 Master (littérature, philologie et linguistique) - Paris IV-Sorbonne.
2008-2015 Doctorat - Université d’Amsterdam.
Emploi
------
2008-2012 Assistant - Université d’Amsterdam.
2012-2014 Chargé de cours - Université de Neuchâtel.
2013-2017 Chargé de cours - Sciences Po Paris.
2015-2018 Collaborateur scientifique (littérature française) - Université de Neuchâtel.
2018-2020 Collaborateur scientifique (humanités numériques) - Université de Neuchâtel
2020 Chargé de cours (humanités numériques) - Université de Genève
2020- Maître-assistant (humanités numériques) - Université de Genève
Publications
- 51
- 29
- 7
- 2
- 1
- 17
- 14
- 11
- 11
- 9
- 8
- 8
- 7
- 7
- 6
- 6
- 6
- 5
- 5
- 5
- 4
- 4
- 3
- 3
- 3
- 3
- 3
- 3
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
|
Harnessing Linguistic Analysis for ADHD Diagnosis Support: A Stylometric Approach to Self-Defining MemoriesRaPID-5@LREC-COLING-2024, Association for Computational Linguistics, May 2024, Turin, Italy
Communication dans un congrès
hal-04558160v1
|
|
CATMuS-Medieval: Consistent Approaches to Transcribing ManuScriptsDH2024, ADHO, Aug 2024, Washington DC, United States
Communication dans un congrès
hal-04346939v1
|
|
Reconnaissance des écritures dans les imprimésHumanistica 2024 - Colloque annuel de l'Association francophone des humanités numériques, Association francophone des humanités numériques, May 2024, Meknès, Maroc
Communication dans un congrès
hal-04557457v1
|
|
Océriser les imprimés du XVIe siècle en langue françaiseHumanistica 2024, Association francophone des humanités numériques, May 2024, Meknès, Maroc
Communication dans un congrès
hal-04555002v1
|
|
Rise and Fall of Theatrical Genres in Early Modern FranceDH Benelux, May 2023, Bruxelles, Belgium
Communication dans un congrès
hal-04093598v1
|
|
Numériser les archives d'histoire de l'artHumanistica 2023, Association francophone des humanités numériques, Jun 2023, Genève, Suisse
Communication dans un congrès
hal-04090312v1
|
|
Louise Labé : une créature de papier?Humanistica 2023, Association francophone des humanités numériques, Jun 2023, Genève, Suisse
Communication dans un congrès
hal-04090284v1
|
|
Detecting Psychological Disorders with StylometryComputational Humanities Research, Dec 2023, Paris, France. ⟨10.31234/osf.io/s5cm3⟩
Communication dans un congrès
hal-04246051v1
|
|
Gallic(orpor)a: Traitement des sources textuelles en diachronie longue de GallicaDataLab de la BnF, Jun 2022, Paris, France
Communication dans un congrès
hal-03716534v1
|
SegmOnto : Vocabulaire contrôlé pour décrire les manuscrits et les imprimésJournée Campus Richelieu, Philippe Chevallier; Charlotte Duvette, Nov 2022, Paris, France
Communication dans un congrès
hal-04024733v1
|
|
|
Automatic Normalisation of Early Modern FrenchLREC 2022 - 13th Language Resources and Evaluation Conference, European Language Resources Association, Jun 2022, Marseille, France. pp.3354-3366, ⟨10.5281/zenodo.5865428⟩
Communication dans un congrès
hal-03540226v2
|
|
Gallic(orpor)a : Extraction, annotation et diffusion de l’information textuelle et visuelle en diachronie longueDataLab de la BnF : Restitution des travaux 2022, DataLab de la BnF, Dec 2022, Paris, France
Communication dans un congrès
hal-03930542v1
|
|
SegmOnto : Vocabulaire contrôlé pour décrire les manuscrits et les imprimésSegmenter et annoter les images : déconstruire pour reconstruire, Nov 2022, Paris, France
Communication dans un congrès
hal-03930487v1
|
Between automatic and manual encodingTEI 2022 conference : Text as data, Sep 2022, Newcastle, United Kingdom. ⟨10.5281/zenodo.7092214⟩
Communication dans un congrès
hal-03780302v1
|
|
|
Le changement linguistique au XVIIe s. : nouvelles approches scriptométriquesCMLF 2022 - 8e Congrès Mondial de Linguistique Française, Jul 2022, Orléans, France. pp.02006.1-14, ⟨10.1051/shsconf/202213802006⟩
Communication dans un congrès
hal-03681556v1
|
Vers l’étude linguistique sur données artificiellesVariation(s) en français, ATILF, Nov 2022, Nancy, France
Communication dans un congrès
hal-03856660v1
|
|
|
From FreEM to D'AlemBERT13th Language Resources and Evaluation Conference - LREC 2022, European Language Resources Association, Jun 2022, Marseille, France. pp.3367-3374
Communication dans un congrès
hal-03596653v1
|
|
Le projet FREEM : ressources, outils et enjeux pour l’étude du français d’Ancien RégimeTALN 2022 - Traitement Automatique des Langues Naturelles, Jun 2022, Avignon, France. pp.154-165
Communication dans un congrès
hal-03701524v1
|
|
A Data-driven Approach to Named Entity Recognition for Early Modern FrenchComputational Linguistics, Oct 2022, Gyeongju, South Korea. pp.3722-3730
Communication dans un congrès
hal-04110765v1
|
Katabase: In Search of Lost ManuscriptsJeRTeh Seminar, Society for Human Languages and Resources — JeRTeh, Jun 2021, Belgrade, Serbia
Communication dans un congrès
hal-03258111v1
|
|
|
The BIR database – Identifying typographic emphasis in list-like historical documentsHIP@ICDAR21 - The 6th International Workshop on Historical Document Imaging and Processing, Sep 2021, Lausanne, Switzerland. ⟨10.1145/3476887.3476913⟩
Communication dans un congrès
hal-03355683v1
|
|
SegmOnto: common vocabulary and practices for analysing the layout of manuscripts (and more)1st International Workshop on Computational Paleography (IWCP@ICDAR 2021), Sep 2021, Lausanne, Switzerland
Communication dans un congrès
hal-03336528v1
|
|
Expanding the content model of annotationBlockNext Gen TEI, 2021 - TEI Conference and Members’ Meeting, Oct 2021, Virtual, United States
Communication dans un congrès
hal-03380805v1
|
SegmOntoCréation de modèle(s) HTR pour les documents médiévaux en ancien français et moyen français entre le Xe-XIVe siècle, Ecole nationale des chartes | PSL, Nov 2021, Paris, France
Communication dans un congrès
hal-03481089v1
|
|
|
Beyond Idiolectometry? On Racine's Stylometric SignatureConference on Computational Humanities Research 2021, Nov 2021, Amsterdam, Netherlands. pp.359-376
Communication dans un congrès
hal-03402994v1
|
|
Pratique manuscrite dans un monde d'imprimés: le cas du Grand siècleSéminaire du laboratoire MNSHS “Philologie numérique”, Jul 2021, Paris, France
Communication dans un congrès
hal-03334147v1
|
|
Open Stemmata: A Digital Collection of Textual GenealogiesEADH2021: Interdisciplinary Perspectives on Data, 2nd International Conference of the European Association for Digital Humanities, Krasnoyarsk, 2021, 2021, Krasnoyarsk, Russia
Communication dans un congrès
halshs-03260086v1
|
From page to content – which TEI representation for HTR output?Next Gen TEI, 2021 - TEI Conference and Members’ Meeting, Oct 2021, Weaton (virtual), United States
Communication dans un congrès
hal-03380807v1
|
|
|
Variation graphique dans les documents d'Ancien Régime : Nouvelles approches scriptométriquesJournée d’étude : « Pour une histoire de la langue ‘par en bas’: textes privés et variation des langues dans le passé », Sep 2021, Paris, France
Communication dans un congrès
hal-03357080v1
|
|
Towards automatic TEI encoding via layout analysisFantastic future 21, 3rd International Conference on Artificial Intelligence for Librairies, Archives and Museums, AI for Libraries, Archives, and Museums (ai4lam), Dec 2021, Paris, France
Communication dans un congrès
hal-03527287v1
|
|
Katabase: À la recherche des manuscrits vendusHumanistica 2021, Humanistica, May 2021, Rennes, France
Communication dans un congrès
hal-03066108v1
|
Graphs vs trees: encoding stemmata in TEINext Gen TEI, 2021 - Book of abstracts, Oct 2021, Virtual, United States
Communication dans un congrès
hal-03380799v1
|
|
Lemmatiser des textes et corriger l'annotation grâcè a l'apprentissage profond avec PyrrhaHumanistica 2021, Humanistica, May 2021, Rennes, France
Communication dans un congrès
hal-03224112v1
|
|
|
A dataset for automatic detection of places in (early) modern French textsNASSCFL 2021 - 50th Annual North American Society for Seventeenth-Century French Literature Conference, NASSCFL, May 2021, Iowa City / Virtual, United States. pp.5
Communication dans un congrès
hal-03187097v1
|
|
Automating Artl@s – extracting data from exhibition cataloguesEADH 2021 - Second International Conference of the European Association for Digital Humanities, Sep 2021, Krasnoyarsk, Russia
Communication dans un congrès
hal-03331838v1
|
|
LEs REprésentations MÉdiévales (LeReMed): (modéliser un) répertoire de performances médiévalesHumanistica 2021, Humanistica, May 2021, Rennes, France
Communication dans un congrès
hal-03186628v1
|
|
Quantifying the Unknown: How many manuscripts of the marquise de Sévigné still exist?Digital Humanities DH2020, ADHO, Jul 2020, Ottawa, Canada
Communication dans un congrès
hal-02898929v1
|
La naissance du style: auteur vs genre aux XVIIe et XIXe sièclesHumanistica 2020, Humanistica, May 2020, Bordeaux, France
Communication dans un congrès
hal-02577853v1
|
|
|
Selling autograph manuscripts in 19th c. Paris: digitising the Revue des AutographesIX Convegno AIUCD, AIUCD, Jan 2020, Milan, Italy
Communication dans un congrès
hal-02388407v1
|
|
Traduction automatique pour la normalisation du français du XVII e siècleTALN 2020, ATALA, Jun 2020, Nancy, France
Communication dans un congrès
hal-02596669v1
|
|
Traduction automatique pour la normalisation du français du XVIIe siècle6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 2 : Traitement Automatique des Langues Naturelles, 2020, Nancy, France. pp.213-222
Communication dans un congrès
hal-02784770v3
|
|
Une introduction linguistique pour les données de Machine learning?Humanistica 2020, Humanistica, May 2020, Bordeaux, France
Communication dans un congrès
hal-02619356v1
|
|
Information Extraction Workflow for Digitised Entry-based DocumentsDARIAH Annual event 2020, May 2020, Zagreb / Virtual, Croatia
Communication dans un congrès
hal-02508549v1
|
|
Standardizing linguistic data: method and tools for annotating (pre-orthographic) FrenchProceedings of the 2nd International Digital Tools & Uses Congress (DTUC '20), Oct 2020, Hammamet, Tunisia. ⟨10.1145/3423603.3423996⟩
Communication dans un congrès
hal-03018381v1
|
|
CORPUS17: a philological corpus for 17th c. FrenchProceedings of the 2nd International Digital Tools & Uses Congress (DTUC ’20), Oct 2020, Hammamet, Tunisia. ⟨10.1145/3423603.3424002⟩
Communication dans un congrès
hal-03041871v1
|
|
Scaling up Automatic Structuring of Manuscript Sales CataloguesTEI 2019: What is text, really? TEI and beyond, Sep 2019, Graz, Austria
Communication dans un congrès
hal-02272962v1
|
|
A Workflow For On The Fly Normalisation Of 17th c. FrenchDH2019, ADHO, Jul 2019, Utrecht, Netherlands
Communication dans un congrès
hal-02276150v1
|
|
A Theatre of Places: Mapping 17 th French TheatreGIR'19 - 13th Workshop on Geographic Information Retrieval, Nov 2019, Lyon, France. ⟨10.1145/3371140.3371146⟩
Communication dans un congrès
hal-02388411v1
|
|
Automatically Encoding Encyclopedic-like Resources in TEIThe annual TEI Conference and Members Meeting, Sep 2018, Tokyo, Japan
Communication dans un congrès
hal-01819505v1
|
Un glossaire pour Madame de SévignéSéminaire de lexicographie (Paris III), Dec 2017, Paris, France
Communication dans un congrès
hal-01948710v1
|
|
Vers un catalogue numérique des manuscrits du XVIIe s.NASSCFL, 2017, Lyon, France
Communication dans un congrès
hal-01943580v1
|
|
Editer le XVIIe s.Forschungskolloquium, Universität Potsdam, Jun 2016, Potsdam, Allemagne
Communication dans un congrès
hal-01948707v1
|
|
Dubious letters of Madame de Sévigné on the autograph market of the 19th c.SE17, 2016, Hanover (NH), United States
Communication dans un congrès
hal-01943578v1
|
|
Dating the Stylistic TurnComputational Humanities Research, Dec 2023, Paris, France
Poster de conférence
hal-04343340v1
|
|
Gallic(orpor)a : Processing Gallica's historical sourcesPoster de conférence hal-03819326v1 |
|
A Data-driven Approach to Named Entity Recognition for Early Modern FrenchComputational Linguistics, Oct 2022, Gyeongju, South Korea. Proceedings of the 29th International Conference on Computational Linguistics, pp.3722-3730
Poster de conférence
hal-04246946v1
|
|
Graphs vs trees: encoding stemmata in TEINext Gen TEI, 2021, Oct 2021, Virtual, United States. Next Gen TEI, 2021 - Book of abstracts
Poster de conférence
hal-03403008v1
|
|
DARIAH ERIC Sustainability RefinedPoster de conférence hal-02137047v1 |
|
E-ditiones, 17th c. French sourcesWorkshop DARIAH-CH, Nov 2018, Neuchâtel, Switzerland
Poster de conférence
hal-02388415v1
|
|
Éditer le Grand Siècle au XIX e s. Remarques sur les choix (ortho)graphiques de quelques éditeursActes du XXIXe Congrès international de linguistique et de philologie romanes, 1, Éditions de linguistique et de philologie, pp.1555-1568, 2021, 978-2-37276-050-8
Chapitre d'ouvrage
hal-01907239v2
|
|
Le Statut juridique de l'acteur en droit canon au Moyen ÂgeMarie Bouhaïk-Gironès. Le Théâtre de l'Église (XIIe-XVIe siècles), LAMOP, pp.102-150, 2011
Chapitre d'ouvrage
hal-03658167v1
|
|
SegmOnto: A Controlled Vocabulary to Describe and Process Digital Facsimiles2023
Pré-publication, Document de travail
hal-04343404v1
|
|
Guide de transcription pour les imprimés français du XVIe siècle en caractères gothiques2023
Pré-publication, Document de travail
hal-04281804v1
|
|
Manuel d'annotation linguistique pour le français moderne (XVIe -XVIIIe siècles)2022
Pré-publication, Document de travail
hal-02571190v2
|
Gallic(orpor)a: Extraction, annotation et diffusion de l'information textuelle et visuelle en diachronie longueBibliothèque nationale de France. 2022
Rapport
hal-04024750v1
|
|
|
D3.4 Final Report[0] DARIAH ERIC; University of Warsaw; University of Helsinki; Swiss Institute of Bioinformatics; King's College London; Glasgow University; University of Neuchâtel; University of Haifa; UNED. 2019
Rapport
hal-02454418v1
|
|
L’Acteur au Moyen Âge: L’Histrion et ses avatars en Occident de saint Augustin à saint ThomasLinguistique. Universiteit van Amsterdam, 2015. Français. ⟨NNT : ⟩
Thèse
tel-01873198v1
|
|
Les catalogues et GROBIDDoctorat. Du catalogue aux humanités numériques : quelles méthodes pour quels résultats ?, Paris, France. 2018
Cours
cel-01951107v1
|