Accéder directement au contenu

Serge Heiden

62
Documents
Identifiants chercheurs

Présentation

Serge Heiden is a research officer at the IHRIM laboratory, École normale supérieure de Lyon (France), and head of the Cactus research group. He holds a PhD in Computer Science from the Pierre et Marie CURIE Paris 6 University. He has developed for two decades the methodology of textual corpus analysis called ’textometry’ through its implementation in several application software. He is involved in the activities of several digital humanities related national (CORLI - TGIR Huma-Num) and international (TEI) consortiums as well as conferences (JADT) and summer schools (MISAT). He regularly gives professional or university training courses. Since 2007, thanks to the initial funding of an ANR project called ’Textométrie’, which lasted four years, he leads the development of the TXM platform for textual corpus analysis intended for both personal computers and web servers. This platform combines classical qualitative (such as concordancers, word lists or hypertextual reading of texts) and quantitative (statistical cooccurrents, clustering, factorial analysis...) text analysis tools with rich representations of texts (encoded according to different idioms of the TEI) and enriched by natural language processing tools (lemmatizers, syntactic parsers ...). This platform is also the place of prototyping of numerous experiments in the field of rich, multimodal and multimedia digital philology, quantitative analysis of complex textual planes and automatic linguistic enrichment for text corpora in many ancient and contemporary languages (from transcriptions of cuneiform tablets from the second millennium BC to tweets of social networks). Current developments in the platform are carried out in the following ANR projects : - ANR-14-FRAL-0006 PaLaFra (2015 - 2018) : open-source lemmatization of medieval French ; - ANR-15-CE38-0008 Democrat (2016 - 2019) : assisted annotation of co-reference chains ; - ANR-16-CE38-0010 Profiterole (2017 - 2020) : open-source syntactic parsing of old French. More information : <http://textometrie.org/?lang=en>.
Serge Heiden est ingénieur de recherche au laboratoire IHRIM &lt;<http://ihrim.ens-lyon.fr>&gt; , École normale supérieure de Lyon (France), et responsable du groupe de recherche Cactus. Il est titulaire d’un doctorat en Informatique de l’Université Pierre et Marie CURIE Paris 6. Il a développé pendant deux décennies la méthodologie d’analyse de corpus textuels appelée ‘textométrie’ à travers son implémentation dans plusieurs logiciels d’application. Il est impliqué dans les activités de plusieurs consortium d’humanités numériques nationaux (CORLI - TGIR Huma-Num) et internationaux (TEI) ainsi que de conférences (JADT) et écoles d’été (MISAT). Il donne régulièrement des cours de formation professionnelle ou universitaire. Depuis 2007, grâce au financement initial d’un projet ANR appelé ‘Textométrie’ et qui a duré quatre ans, il anime le développement de la plateforme TXM d’analyse de corpus textuels destinée à la fois aux ordinateurs personnels de chercheurs et à des serveurs web. Cette plateforme combine des outils d’analyse de textes classiques qualitatifs (comme les concordanciers, les listes de mots ou la lecture hypertextuelle d’éditions de textes) et quantitatifs (cooccurrents statistiques, classification, analyse factorielle...) avec des représentations riches des textes (encodés selon différents idiomes de la TEI) et enrichis par des outils de traitement automatique de la langue (lemmatiseurs, analyseurs syntaxiques...). Cette plateforme est également le lieu de prototypage de nombreuses expérimentations dans le domaine de la philologie numérique riche, multimodale et multimédia, l’analyse quantitative de plans textuels complexes et l’enrichissement linguistique automatique pour des corpus de textes en de nombreuses langues anciennes et contemporaines (de transcriptions de tablettes cunéiformes du IIe mil. av. J.-C. aux tweets des réseaux sociaux). Les développements en cours dans la plateforme sont notamment réalisés au sein des projets ANR suivants : - ANR-14-FRAL-0006 PaLaFra (2015 – 2018) : lemmatisation open-source du français médiéval ; - ANR-15-CE38-0008 Democrat (2016 – 2019) : annotation assistée de chaînes de co-références ; - ANR-16-CE38-0010 Profiterole (2017 – 2020) : analyse syntaxique open-source de l’ancien français. Plus d’informations : <http://textometrie.org>.

Publications

Image document

Transdisciplinary Analysis of a Corpus of French Newsreels: The ANTRACT Project

Jean Carrive , Abdelkrim Beloued , Pascale Goetschel , Serge Heiden , Antoine Laurent
Digital Humanities Quarterly, 2021, Special Issue on AudioVisual Data in DH, 15 (1)
Article dans une revue hal-03166755v1

Enjeux philologiques, linguistiques et informatiques de la philologie numérique : l’exemple de la segmentation des mots

Alexei Lavrentiev , Céline Guillot , Serge Heiden
Diachroniques. Revue de Linguistique française diachronique, 2021, 8, pp.77-102
Article dans une revue halshs-03243774v1

Collective memory shapes the organization of individual memories in the medial prefrontal cortex

Pierre Gagnepain , Thomas Vallée , Serge Heiden , Matthieu Decorde , Jean-Luc Gauvain
Nature Human Behaviour, 2020, 4 (2), pp.189-200. ⟨10.1038/s41562-019-0779-z⟩
Article dans une revue hal-03091818v1
Image document

Collective memory shapes the organization of individual memories in the medial prefrontal cortex

Pierre Gagnepain , Thomas Vallée , Serge Heiden , Matthieu Decorde , Jean-Luc Gauvain
Nature Human Behaviour, 2019, ⟨10.1038/s41562-019-0779-z⟩
Article dans une revue halshs-02416130v1
Image document

Base de français médiéval : une base de référence de sources médiévales ouverte et libre au service de la communauté scientifique

Céline Guillot , Serge Heiden , Alexei Lavrentiev
Diachroniques. Revue de Linguistique française diachronique, 2018, Les états anciens des langues à l’heure du numérique, 7, pp.168-184
Article dans une revue halshs-01809581v1
Image document

Exploration textométrique du corpus des dossiers de Bouvard et Pécuchet

Alexei Lavrentiev , Serge Heiden
Revue Flaubert, 2014, 13 - "Les dossiers documentaires de Bouvard et Pécuchet" : l'édition numérique du creuset flaubertie, pp.1-12
Article dans une revue halshs-00678874v1

Quand l'eau fait la loi : de l'eau-ressource à l'eau-territoire (1898-2006)

Yves-François Le Lay , Emeline Comby , Stéphanie de Carrara , Serge Heiden
Le Discours et la Langue Revue de linguistique française et d'analyse du discours, 2013, 5 (1), pp.125-142
Article dans une revue halshs-00940834v1
Image document

Usages linguistiques de la textométrie : analyse qualitative de la consultation de la Base de Français Médiéval via le logiciel Weblex

Bénédicte Pincemin , Céline Guillot , Serge Heiden , Alexei Lavrentiev , Christiane Marchello-Nizia
Syntaxe et Sémantique, 2008, 9, pp.87-110
Article dans une revue halshs-00355461v1

Typologie des textes et des phénomènes linguistiques pour l'analyse du changement linguistique avec la Base de Français Médiéval

Céline Guillot , Serge Heiden , Alexei Lavrentiev
Linx, 2007, N° spécial (2e trimestre), pp.125-139
Article dans une revue halshs-00324180v1

Ressources électroniques pour l'étude des textes médiévaux : approches et outils

Serge Heiden , Alexei Lavrentiev
Revue Française de Linguistique Appliquée, 2004, Vol. 9 (N° 1 (Juin 2004)), pp.91- 102
Article dans une revue halshs-00425257v1

Lectures assistées de l'Encyclopédie électronique : Philologic et Weblex

Serge Heiden , Pierre Lafon
Recherches sur Diderot et sur l'Encyclopédie, 2002, N° 31-32 (Avril 2002), pp.91- 102
Article dans une revue halshs-00425258v1
Image document

Encodage SGML de corpus: application à l'étude d'un débat parlementaire

Serge Heiden
Mots: les langages du politique, 1999, N° 60, pp.113-132
Article dans une revue halshs-00151845v1
Image document

The textometric concept of active corpus

Bénédicte Pincemin , Serge Heiden , Franck Mazuet
16th International Conference on Statistical Analysis of Textual Data JADT 2022, VADISTAT - Per Simona Balbi, Univ. of Naples Federico II, Jul 2022, Naples, Italy. pp.691-698
Communication dans un congrès halshs-03667319v1

Introduction historique et méthodologique à la textométrie et au logiciel TXM

Serge Heiden
Semaine Data-SHS, PUDD; PROGEDO, Dec 2020, Dijon, France
Communication dans un congrès hal-04006307v1
Image document

Textometry on Audiovisual Corpora

Bénédicte Pincemin , Serge Heiden , Matthieu Decorde
15th International Conference on Statistical Analysis of Textual Data JADT 2020, Laboratoire d’Etudes et Recherches Appliquées en Sciences Sociales (Lerass), EA827, Université de Toulouse 3 - Paul Sabatier, Jun 2020, Toulouse, France
Communication dans un congrès halshs-02779055v1
Image document

Textometric Exploitation of Coreference-annotated Corpora with TXM: Methodological Choices and First Outcomes

Matthieu Quignard , Serge Heiden , Frédéric Landragin , Matthieu Decorde
Fourteenth International Conference on the Statistical Analysis of Textual Data, Jun 2018, Rome, Italy. pp.610-615
Communication dans un congrès hal-01814858v1

Métopes + TXM: Integrating Text Publishing and Text Analysis Tools Based on TEI Encoding

Alexei Lavrentiev , Serge Heiden , Charles Bourdot
18th Annual TEI Conference and Memberrs' Meeting, Sep 2018, Tokyo, Japan. pp.255-256
Communication dans un congrès halshs-03363491v1
Image document

XML-TEI-URS: using a TEI format for annotated linguistic resources

Loïc Grobol , Frédéric Landragin , Serge Heiden
CLARIN Annual Conference 2018, Oct 2018, Pisa, Italy
Communication dans un congrès hal-01827563v1

Annotation-based Digital Text Corpora Analysis within the TXM Platform

Serge Heiden
14th International Conference on the Statistical Analysis of Textual Data / 14es Journées internationales d'Analyse statistique des Données Textuelles (JADT 2018), DII– Department of Enterprise Engineering “Mario Lucertini” Tor Vergata University; DSS– Department of Statistical Sciences, Sapienza University, Rome, Jun 2018, Rome, Italy. pp.367-374
Communication dans un congrès hal-02015898v1

Chaînes de référence, structuration textuelle et genres textuels en diachronie : premières explorations du corpus Democrat

Matthieu Decorde , Céline Guillot , Serge Heiden , Matthieu Quignard
Journée d’étude « Référence, coréférence et structure textuelle », Nov 2017, Lyon, France
Communication dans un congrès hal-01680577v1
Image document

Building an Open Morphological Lexicon and Lemmatizing Old French Texts with the TXM Platform

Alexei Lavrentiev , Serge Heiden , Matthieu Decorde
Corpus linguistics - 2017, St-Petersburg State University; Institute for Linguistic Studies (RAS); Herzen State Pedagogical University of Russia, Jun 2017, St-Pétersbourg, Russia. pp.48-52
Communication dans un congrès halshs-01591122v1
Image document

Interoperable annotation of (co)references in the Democrat project

Loïc Grobol , Frédéric Landragin , Serge Heiden
Thirteenth Joint ISO-ACL Workshop on Interoperable Semantic Annotation, ACL Special Interest Group on Computational Semantics (SIGSEM); ISO TC 37/SC 4 (Language Resources) WG 2, Sep 2017, Montpellier, France
Communication dans un congrès hal-01583527v2
Image document

Génétique mémorielle. Shoah, mémoire et ADT

Bénédicte Pincemin , Damon Mayaffre , Serge Heiden , Philippe Weyl
JADT 2016 - Statistical Analysis of Textual Data, Damon Mayaffre; Céline Poudat; Laurent Vanni; Véronique Magri; Peter Follette; Caroline Daire, Jun 2016, Nice, France. pp.495-506
Communication dans un congrès hal-01361988v1

Reengineering Akkadian Tablets with TEI and TXM for Linguistic Analysis

Marine Béranger , Serge Heiden , Alexei Lavrentiev
TEI Conference and Members' Meeting, Oct 2015, Lyon, France. pp.36
Communication dans un congrès halshs-01318713v1
Image document

Analyzing TEI encoded texts with the TXM platform

Alexei Lavrentiev , Serge Heiden , Matthieu Decorde
The Linked TEI: Text Encoding in the Web. TEI Conference and Members Meeting 2013, Oct 2013, Rome, Italy
Communication dans un congrès halshs-01118120v1

Retour de pêche. Le métier de pêcheur à travers le discours des professionnels français du Lac Léman

Yves-François Le Lay , Serge Heiden , Luc Merchez , Bénédicte Pincemin
Colloque international "Corpus de textes : composer, mesurer, interpréter", Laboratoire junior Des nombres et des mots (N&Ms), ENS de Lyon, Jun 2013, Lyon, France
Communication dans un congrès halshs-01372580v1

Constructing Analytic Data Categories for Corpus Analysis from TEI encoded sources

Alexei Lavrentiev , Serge Heiden
Text Encoding Initiative Conference 2012, Nov 2012, College Station, TX, United States
Communication dans un congrès halshs-00808449v1

The TXM Portal Software giving access to Old French Manuscripts Online

Alexei Lavrentiev , Serge Heiden
7th International Conference on Language Resources and Evaluation (LREC), May 2012, Istanbul, Turkey. pp.29-35
Communication dans un congrès halshs-00759361v1
Image document

The TXM Platform : Building Open-Source Textual Analysis Software Compatible with the TEI Encoding Scheme

Serge Heiden
24th Pacific Asia Conference on Language, Information and Computation, Nov 2010, Sendai, Japan. pp.389‑398
Communication dans un congrès halshs-00549764v1
Image document

TXM : Une plateforme logicielle open-source pour la textométrie - conception et développement

Serge Heiden , Jean-Philippe Magué , Bénédicte Pincemin
10th International Conference on the Statistical Analysis of Textual Data - JADT 2010, Jun 2010, Rome, Italie. pp.1021-1032
Communication dans un congrès halshs-00549779v1

TEI P5 Manuscript Transcriptions as a Resource for Linguistic Research

Alexei Lavrentiev , Serge Heiden
TEI Applied: Digital Texts and Language Resources, Nov 2010, Zadar, Croatia
Communication dans un congrès halshs-00620103v1

Fonctionnalités textométriques : proposition de typologie selon un point de vue utilisateur

Bénédicte Pincemin , Serge Heiden , Marie-Hélène Lay , Jean-Marc Leblanc , Jean-Marie Viprey
Dixièmes Journées internationales d'Analyse Statistique des données Textuelles, 2010, Rome, Italie. pp.341-353
Communication dans un congrès halshs-00856446v1

The TextometrieR package: textual data analysis for social sciences and humanities

Sylvain Loiseau , Jean-Philippe Magué , Serge Heiden
useR!, Jul 2009, Rennes, France. pp.En ligne
Communication dans un congrès halshs-00984192v1

La modélisation des phénomènes linguistiques

Serge Heiden
Atelier ATHIS IV (IVe Atelier Informatique et Histoire), l'informatique et l'utilisation des statistiques par les historiens, Sep 2007, Lyon, France
Communication dans un congrès halshs-00377553v1

Les logiciels de traitement informatique du texte, table ronde animée par Alain Dallo (LAMOP)

Serge Heiden
ATHIS II, IIe Atelier Informatique et Histoire, l'historien, le texte et l'ordinateur, Nov 2006, Lyon, France
Communication dans un congrès halshs-00377552v1

Atelier numérique pour l'historien : les différents niveaux d'observables automatiques

Serge Heiden
Colloque de l'École Doctorale d'Histoire de Paris I, Oct 2006, Paris, France
Communication dans un congrès halshs-00377545v1

Un modèle de données pour la textométrie : contribution à une interopérabilité entre outils

Serge Heiden
8es Journées internationales d'analyse statistique des données textuelles, Apr 2006, Besançon, France. pp.487-498
Communication dans un congrès halshs-00355449v1

Interface hypertextuelle à un espace de cooccurrences : implémentation dans Weblex

Serge Heiden
7ième Journées internationales d'Analyse Statistique des Données Textuelles (JADT'04), Mar 2004, Louvain-la-Neuve, Belgique. pp.577-588
Communication dans un congrès halshs-00381011v1
Image document

Illustration d'une méthode lexicométrique des cooccurrences sur un corpus historique

Serge Heiden
Société des études robespierristes - Journée d'études du 23 novembre 2002 (Sorbonne), 2003, Paris, France. pp.105-122
Communication dans un congrès halshs-00151844v1
Image document

Capitalisation des savoirs par le web : une application de la TEI pour l'encodage et l'exploitation des textes de la Base de Français Médiéval

Serge Heiden , Céline Guillot
colloque d'Ottawa, 4-5 oct. 2002, 2003, Ottawa, Canada. pp.77-92
Communication dans un congrès halshs-00151843v1
Image document

Lexicométrie textuelle, sens et stratégie discursive

Serge Heiden , Maurice Tournier
Simposio internacional de análisis del discurso, 2001, Madrid, Espagne. pp.2287-2300
Communication dans un congrès halshs-00151838v1
Image document

Méthode des cooccurrences : recherche sémantique sur le nom propre

Serge Heiden , Lamria Chetouani
5e journées internationales d'Analyse Statistiques des Données Textuelles (JADT'2000), 2000, Pagination non précisée
Communication dans un congrès halshs-00151842v1
Image document

TyPTex : Inductive typological text classification by multivariate statistical analysis for NLP systems tuning/evaluation

Serge Heiden , Sophie Prévost , Benoît Habert , Helka Folch , Serge Fleury
Maria Gavrilidou, George Carayannis, Stella Markantonatou, Stelios Piperidis, Gregory Stainhaouer (éds) Second International Conference on Language Resources and Evaluation, 2000, p. 141-148
Communication dans un congrès halshs-00087993v1
Image document

Profilage de textes : un cadre de travail et une expérience

Serge Heiden , Sophie Prévost , Benoît Habert , Gabriel Illouz , Pierre Lafon
JADT'2000, 2000, Lausanne, Suisse. Pagination non précisée
Communication dans un congrès halshs-00151839v1
Image document

Prendre Le Monde en main : choix d'architecture

Serge Heiden , Pierre Lafon , Gabriel Illouz , Benoît Habert , Serge Fleury
RIAO 2000, 2000, Pagination non précisée
Communication dans un congrès halshs-00151840v1
Image document

Catégorisation d'un corpus hétérogène de français médiéval

Sophie Prévost , Serge Heiden , Fernande Dupuis
Actes du colloque ‘JADT 2000 : 5es Journées Internationales d'Analyse Statistique des Données Textuelles' Lausanne, 2000, 2000, p. 485-492
Communication dans un congrès halshs-00087770v1
Image document

Maîtriser les déluges de données hétérogènes

Serge Heiden , Pierre Lafon , Gabriel Illouz , Benoît Habert , Serge Fleury
1999, Cargèse, Italie. pp.37-46
Communication dans un congrès halshs-00151841v1
Image document

Diachronie de l'oral représenté

Céline Guillot-Barbance , Alexei Lavrentiev , Serge Heiden , Bénédicte Pincemin
Wendy Ayres-Benett; Anne Carlier; Julie Glikman; Thomas Rainsford; Gilles Siouffi; Carine Skupien Dekens. Nouvelles voies d’accès au changement linguistique. Actes du colloque de la SIDF, Classiques Garnier, pp.279-296, 2018, Nouvelles voies d’accès au changement linguistique. Actes du colloque de la SIDF, ⟨10.15122/isbn.978-2-406-06946-1.p.0279⟩
Chapitre d'ouvrage halshs-01313822v1
Image document

L'évolution de la mémoire de la Shoah au prisme de la statistique textuelle

Damon Mayaffre , Bénédicte Pincemin , Serge Heiden , Philippe Weyl
Denis Peschanski; Brigitte Sion. La vérité du témoin, 2, Hermann Éditeurs; Institut National de l’Audiovisuel, pp.93-124, 2018, Mémoire et mémorialisation, 9782705697365
Chapitre d'ouvrage hal-01890536v1
Image document

La " philologie numérique " : tentative de définition d'un nouvel objet éditorial

Céline Guillot , Alexei Lavrentiev , Thomas Rainsford , Christiane Marchello-Nizia , Serge Heiden
Richard Trachsler; Frédéric Duval; Lino Leonardi. Actes du XXVIIe Congrès international de linguistique et de philologie romanes (Nancy, 15-20 juillet 2013). Section 13 : Philologie textuelle et éditoriale, ATILF/SLR, pp.143-154, 2017, 979-10-91460-29-3
Chapitre d'ouvrage halshs-00846767v1

Retour de pêche

Yves-François Le Lay , Serge Heiden , Luc Merchez , Bénédicte Pincemin
Corpus de textes : composer, mesurer, interpréter, ENS Editions, pp.117-134, 2016, 978-2-84788-827-0. ⟨10.4000/books.enseditions.7360⟩
Chapitre d'ouvrage halshs-01423605v1
Image document

L'oral représenté dans un corpus de français médiéval (9e-15e) : approche contrastive et outillée de la variation diasystémique

Céline Guillot , Serge Heiden , Alexei Lavrentiev , Bénédicte Pincemin
Kirsten Jeppesen Kragh; Jan Lindschouw. Les variations diasystémiques et leurs interdépendances dans les langues romanes. Actes du Colloque DIA II à Copenhague (19-21 nov. 2012), Éditions de linguistique et de philologie, pp.15-28, 2015, 9782372760027
Chapitre d'ouvrage halshs-00760647v2
Image document

Le discours direct au Moyen Âge : vers une définition et une méthodologie d'analyse

Céline Guillot , Alexei Lavrentiev , Bénédicte Pincemin , Serge Heiden
Dominique Lagorgette ; Pierre Larrivée. Représentations du sens linguistique 5, Université de Savoie, pp.17-41, 2013, Langages, 14, 9782919732159
Chapitre d'ouvrage halshs-00820262v1
Image document

Étiquetage d'un corpus hétérogène de français médiéval : enjeux et modalités

Serge Heiden , Sophie Prévost
C.D. Pusch et W. Raible. Romance Corpus Linguistics - Corpora and Spoken Language, Tübingen, Gunter Narr Verlag Tübingen, p. 127-136, 2002
Chapitre d'ouvrage halshs-00087995v1

Sémantique des noms propres. Méthode des cooccurrences

Lamria Chetouani , Heiden Serge
M. Rajman & J-C. Chappelier. JADT 2000. 5èmes Journées internationales d'Analyse statistique des Données Textuelles, n°2, Ecole Polytechnique de Lausanne (EPA), pp. 575-578, 2000
Chapitre d'ouvrage halshs-01160786v1