Accéder directement au contenu

Serge Heiden

16
Documents
Identifiants chercheurs

Présentation

Serge Heiden is a research officer at the IHRIM laboratory, École normale supérieure de Lyon (France), and head of the Cactus research group. He holds a PhD in Computer Science from the Pierre et Marie CURIE Paris 6 University. He has developed for two decades the methodology of textual corpus analysis called ’textometry’ through its implementation in several application software. He is involved in the activities of several digital humanities related national (CORLI - TGIR Huma-Num) and international (TEI) consortiums as well as conferences (JADT) and summer schools (MISAT). He regularly gives professional or university training courses. Since 2007, thanks to the initial funding of an ANR project called ’Textométrie’, which lasted four years, he leads the development of the TXM platform for textual corpus analysis intended for both personal computers and web servers. This platform combines classical qualitative (such as concordancers, word lists or hypertextual reading of texts) and quantitative (statistical cooccurrents, clustering, factorial analysis...) text analysis tools with rich representations of texts (encoded according to different idioms of the TEI) and enriched by natural language processing tools (lemmatizers, syntactic parsers ...). This platform is also the place of prototyping of numerous experiments in the field of rich, multimodal and multimedia digital philology, quantitative analysis of complex textual planes and automatic linguistic enrichment for text corpora in many ancient and contemporary languages (from transcriptions of cuneiform tablets from the second millennium BC to tweets of social networks). Current developments in the platform are carried out in the following ANR projects : - ANR-14-FRAL-0006 PaLaFra (2015 - 2018) : open-source lemmatization of medieval French ; - ANR-15-CE38-0008 Democrat (2016 - 2019) : assisted annotation of co-reference chains ; - ANR-16-CE38-0010 Profiterole (2017 - 2020) : open-source syntactic parsing of old French. More information : <http://textometrie.org/?lang=en>.
Serge Heiden est ingénieur de recherche au laboratoire IHRIM &lt;<http://ihrim.ens-lyon.fr>&gt; , École normale supérieure de Lyon (France), et responsable du groupe de recherche Cactus. Il est titulaire d’un doctorat en Informatique de l’Université Pierre et Marie CURIE Paris 6. Il a développé pendant deux décennies la méthodologie d’analyse de corpus textuels appelée ‘textométrie’ à travers son implémentation dans plusieurs logiciels d’application. Il est impliqué dans les activités de plusieurs consortium d’humanités numériques nationaux (CORLI - TGIR Huma-Num) et internationaux (TEI) ainsi que de conférences (JADT) et écoles d’été (MISAT). Il donne régulièrement des cours de formation professionnelle ou universitaire. Depuis 2007, grâce au financement initial d’un projet ANR appelé ‘Textométrie’ et qui a duré quatre ans, il anime le développement de la plateforme TXM d’analyse de corpus textuels destinée à la fois aux ordinateurs personnels de chercheurs et à des serveurs web. Cette plateforme combine des outils d’analyse de textes classiques qualitatifs (comme les concordanciers, les listes de mots ou la lecture hypertextuelle d’éditions de textes) et quantitatifs (cooccurrents statistiques, classification, analyse factorielle...) avec des représentations riches des textes (encodés selon différents idiomes de la TEI) et enrichis par des outils de traitement automatique de la langue (lemmatiseurs, analyseurs syntaxiques...). Cette plateforme est également le lieu de prototypage de nombreuses expérimentations dans le domaine de la philologie numérique riche, multimodale et multimédia, l’analyse quantitative de plans textuels complexes et l’enrichissement linguistique automatique pour des corpus de textes en de nombreuses langues anciennes et contemporaines (de transcriptions de tablettes cunéiformes du IIe mil. av. J.-C. aux tweets des réseaux sociaux). Les développements en cours dans la plateforme sont notamment réalisés au sein des projets ANR suivants : - ANR-14-FRAL-0006 PaLaFra (2015 – 2018) : lemmatisation open-source du français médiéval ; - ANR-15-CE38-0008 Democrat (2016 – 2019) : annotation assistée de chaînes de co-références ; - ANR-16-CE38-0010 Profiterole (2017 – 2020) : analyse syntaxique open-source de l’ancien français. Plus d’informations : <http://textometrie.org>.

Publications

benedicte-pincemin
Image document

The textometric concept of active corpus

Bénédicte Pincemin , Serge Heiden , Franck Mazuet
16th International Conference on Statistical Analysis of Textual Data JADT 2022, VADISTAT - Per Simona Balbi, Univ. of Naples Federico II, Jul 2022, Naples, Italy. pp.691-698
Communication dans un congrès halshs-03667319v1
Image document

Textometry on Audiovisual Corpora

Bénédicte Pincemin , Serge Heiden , Matthieu Decorde
15th International Conference on Statistical Analysis of Textual Data JADT 2020, Laboratoire d’Etudes et Recherches Appliquées en Sciences Sociales (Lerass), EA827, Université de Toulouse 3 - Paul Sabatier, Jun 2020, Toulouse, France
Communication dans un congrès halshs-02779055v1
Image document

Génétique mémorielle. Shoah, mémoire et ADT

Bénédicte Pincemin , Damon Mayaffre , Serge Heiden , Philippe Weyl
JADT 2016 - Statistical Analysis of Textual Data, Damon Mayaffre; Céline Poudat; Laurent Vanni; Véronique Magri; Peter Follette; Caroline Daire, Jun 2016, Nice, France. pp.495-506
Communication dans un congrès hal-01361988v1

Retour de pêche. Le métier de pêcheur à travers le discours des professionnels français du Lac Léman

Yves-François Le Lay , Serge Heiden , Luc Merchez , Bénédicte Pincemin
Colloque international "Corpus de textes : composer, mesurer, interpréter", Laboratoire junior Des nombres et des mots (N&Ms), ENS de Lyon, Jun 2013, Lyon, France
Communication dans un congrès halshs-01372580v1
Image document

TXM : Une plateforme logicielle open-source pour la textométrie - conception et développement

Serge Heiden , Jean-Philippe Magué , Bénédicte Pincemin
10th International Conference on the Statistical Analysis of Textual Data - JADT 2010, Jun 2010, Rome, Italie. pp.1021-1032
Communication dans un congrès halshs-00549779v1

Fonctionnalités textométriques : proposition de typologie selon un point de vue utilisateur

Bénédicte Pincemin , Serge Heiden , Marie-Hélène Lay , Jean-Marc Leblanc , Jean-Marie Viprey
Dixièmes Journées internationales d'Analyse Statistique des données Textuelles, 2010, Rome, Italie. pp.341-353
Communication dans un congrès halshs-00856446v1

JADT 2008

Serge Heiden , Bénédicte Pincemin
Presses universitaires de Lyon, pp.1198, 2008
Ouvrages halshs-00377521v1
Image document

Diachronie de l'oral représenté

Céline Guillot-Barbance , Alexei Lavrentiev , Serge Heiden , Bénédicte Pincemin
Wendy Ayres-Benett; Anne Carlier; Julie Glikman; Thomas Rainsford; Gilles Siouffi; Carine Skupien Dekens. Nouvelles voies d’accès au changement linguistique. Actes du colloque de la SIDF, Classiques Garnier, pp.279-296, 2018, Nouvelles voies d’accès au changement linguistique. Actes du colloque de la SIDF, ⟨10.15122/isbn.978-2-406-06946-1.p.0279⟩
Chapitre d'ouvrage halshs-01313822v1
Image document

L'évolution de la mémoire de la Shoah au prisme de la statistique textuelle

Damon Mayaffre , Bénédicte Pincemin , Serge Heiden , Philippe Weyl
Denis Peschanski; Brigitte Sion. La vérité du témoin, 2, Hermann Éditeurs; Institut National de l’Audiovisuel, pp.93-124, 2018, Mémoire et mémorialisation, 9782705697365
Chapitre d'ouvrage hal-01890536v1

Retour de pêche

Yves-François Le Lay , Serge Heiden , Luc Merchez , Bénédicte Pincemin
Corpus de textes : composer, mesurer, interpréter, ENS Editions, pp.117-134, 2016, 978-2-84788-827-0. ⟨10.4000/books.enseditions.7360⟩
Chapitre d'ouvrage halshs-01423605v1
Image document

L'oral représenté dans un corpus de français médiéval (9e-15e) : approche contrastive et outillée de la variation diasystémique

Céline Guillot , Serge Heiden , Alexei Lavrentiev , Bénédicte Pincemin
Kirsten Jeppesen Kragh; Jan Lindschouw. Les variations diasystémiques et leurs interdépendances dans les langues romanes. Actes du Colloque DIA II à Copenhague (19-21 nov. 2012), Éditions de linguistique et de philologie, pp.15-28, 2015, 9782372760027
Chapitre d'ouvrage halshs-00760647v2
Image document

Le discours direct au Moyen Âge : vers une définition et une méthodologie d'analyse

Céline Guillot , Alexei Lavrentiev , Bénédicte Pincemin , Serge Heiden
Dominique Lagorgette ; Pierre Larrivée. Représentations du sens linguistique 5, Université de Savoie, pp.17-41, 2013, Langages, 14, 9782919732159
Chapitre d'ouvrage halshs-00820262v1