Accéder directement au contenu

Identifiants chercheur

Mots-clés

Co-auteurs

Projets ANR

Nombre de documents

58

Serge Heiden


Serge Heiden est ingénieur de recherche au laboratoire IHRIM <http://ihrim.ens-lyon.fr> , École normale supérieure de Lyon (France), et responsable du groupe de recherche Cactus.

Il est titulaire d’un doctorat en Informatique de l’Université Pierre et Marie CURIE Paris 6. Il a développé pendant deux décennies la méthodologie d’analyse de corpus textuels appelée ‘textométrie’ à travers son implémentation dans plusieurs logiciels d’application. Il est impliqué dans les activités de plusieurs consortium d’humanités numériques nationaux (CORLI - TGIR Huma-Num) et internationaux (TEI) ainsi que de conférences (JADT) et écoles d’été (MISAT). Il donne régulièrement des cours de formation professionnelle ou universitaire.

Depuis 2007, grâce au financement initial d’un projet ANR appelé ‘Textométrie’ et qui a duré quatre ans, il anime le développement de la plateforme TXM d’analyse de corpus textuels destinée à la fois aux ordinateurs personnels de chercheurs et à des serveurs web.

Cette plateforme combine des outils d’analyse de textes classiques qualitatifs (comme les concordanciers, les listes de mots ou la lecture hypertextuelle d’éditions de textes) et quantitatifs (cooccurrents statistiques, classification, analyse factorielle...) avec des représentations riches des textes (encodés selon différents idiomes de la TEI) et enrichis par des outils de traitement automatique de la langue (lemmatiseurs, analyseurs syntaxiques...).

Cette plateforme est également le lieu de prototypage de nombreuses expérimentations dans le domaine de la philologie numérique riche, multimodale et multimédia, l’analyse quantitative de plans textuels complexes et l’enrichissement linguistique automatique pour des corpus de textes en de nombreuses langues anciennes et contemporaines (de transcriptions de tablettes cunéiformes du IIe mil. av. J.-C. aux tweets des réseaux sociaux).

Les développements en cours dans la plateforme sont notamment réalisés au sein des projets ANR suivants :

  • ANR-14-FRAL-0006 PaLaFra (2015 – 2018) : lemmatisation open-source du français médiéval ;
  • ANR-15-CE38-0008 Democrat (2016 – 2019) : annotation assistée de chaînes de co-références ;
  • ANR-16-CE38-0010 Profiterole (2017 – 2020) : analyse syntaxique open-source de l’ancien français.

 

Plus d’informations : http://textometrie.org.


Article dans une revue11 documents

  • Jean Carrive, Abdelkrim Beloued, Pascale Goetschel, Serge Heiden, Antoine Laurent, et al.. Transdisciplinary Analysis of a Corpus of French Newsreels: The ANTRACT Project. Digital Humanities Quarterly, Alliance of Digital Humanities, 2021, Special Issue on AudioVisual Data in DH, 15 (1). ⟨hal-03166755⟩
  • Pierre Gagnepain, Thomas Vallée, Serge Heiden, Matthieu Decorde, Jean-Luc Gauvain, et al.. Collective memory shapes the organization of individual memories in the medial prefrontal cortex. Nature Human Behaviour, Nature Research 2020, 4 (2), pp.189-200. ⟨10.1038/s41562-019-0779-z⟩. ⟨hal-03091818⟩
  • Pierre Gagnepain, Thomas Vallée, Serge Heiden, Matthieu Decorde, Jean-Luc Gauvain, et al.. Collective memory shapes the organization of individual memories in the medial prefrontal cortex. Nature Human Behaviour, Nature Research 2019, ⟨10.1038/s41562-019-0779-z⟩. ⟨halshs-02416130⟩
  • Céline Guillot, Serge Heiden, Alexei Lavrentiev. Base de français médiéval : une base de référence de sources médiévales ouverte et libre au service de la communauté scientifique. Diachroniques. Revue de Linguistique française diachronique, Presses de l'Université Paris-Sorbonne (PUPS), 2018, Les états anciens des langues à l’heure du numérique, pp.168-184. ⟨halshs-01809581⟩
  • Alexei Lavrentiev, Serge Heiden. Exploration textométrique du corpus des dossiers de Bouvard et Pécuchet. Revue Flaubert, Centre Flaubert, 2014, pp.1-12. ⟨halshs-00678874⟩
  • Yves-François Le Lay, Emeline Comby, Stéphanie de Carrara, Serge Heiden. Quand l'eau fait la loi : de l'eau-ressource à l'eau-territoire (1898-2006). Le discours et la langue, Cortil-Wodon: Editions modulaires européennes, 2013, 5 (1), pp.125-142. ⟨halshs-00940834⟩
  • Bénédicte Pincemin, Céline Guillot, Serge Heiden, Alexei Lavrentiev, Christiane Marchello-Nizia. Usages linguistiques de la textométrie : analyse qualitative de la consultation de la Base de Français Médiéval via le logiciel Weblex. Syntaxe et Sémantique, Presses Universitaires de Caen, 2008, pp.87-110. ⟨halshs-00355461⟩
  • Céline Guillot, Serge Heiden, Alexei Lavrentiev. Typologie des textes et des phénomènes linguistiques pour l'analyse du changement linguistique avec la Base de Français Médiéval. Linx, Presses Universitaires de Paris Nanterre, 2007, pp.125-139. ⟨halshs-00324180⟩
  • Serge Heiden, Alexei Lavrentiev. Ressources électroniques pour l'étude des textes médiévaux : approches et outils. Revue Française de Linguistique Appliquée, Paris : Publications linguistiques, 2004, Vol. 9 (N° 1 (Juin 2004)), pp.91- 102. ⟨halshs-00425257⟩
  • Serge Heiden, Pierre Lafon. Lectures assistées de l'Encyclopédie électronique : Philologic et Weblex. Recherches sur Diderot et sur l'Encyclopédie, Société Diderot, 2002, pp.91- 102. ⟨halshs-00425258⟩
  • Serge Heiden. Encodage SGML de corpus: application à l'étude d'un débat parlementaire. Mots: les langages du politique, ENS Éditions (Lyon), 1999, pp.113-132. ⟨halshs-00151845⟩

Communication dans un congrès32 documents

  • Bénédicte Pincemin, Serge Heiden, Matthieu Decorde. Textometry on Audiovisual Corpora: Experiments with TXM software. 15th International Conference on Statistical Analysis of Textual Data JADT 2020, Laboratoire d’Etudes et Recherches Appliquées en Sciences Sociales (Lerass), EA827, Université de Toulouse 3 - Paul Sabatier, Jun 2020, Toulouse, France. ⟨halshs-02779055⟩
  • Matthieu Quignard, Serge Heiden, Frédéric Landragin, Matthieu Decorde. Textometric Exploitation of Coreference-annotated Corpora with TXM: Methodological Choices and First Outcomes. Fourteenth International Conference on the Statistical Analysis of Textual Data, Jun 2018, Rome, Italy. pp.610-615. ⟨hal-01814858⟩
  • Serge Heiden. Annotation-based Digital Text Corpora Analysis within the TXM Platform. 14th International Conference on the Statistical Analysis of Textual Data / 14es Journées internationales d'Analyse statistique des Données Textuelles (JADT 2018), DII– Department of Enterprise Engineering “Mario Lucertini” Tor Vergata University; DSS– Department of Statistical Sciences, Sapienza University, Rome, Jun 2018, Rome, Italy. pp.367-374. ⟨hal-02015898⟩
  • Loïc Grobol, Frédéric Landragin, Serge Heiden. XML-TEI-URS: using a TEI format for annotated linguistic resources. CLARIN Annual Conference 2018, Oct 2018, Pisa, Italy. ⟨hal-01827563⟩
  • Loïc Grobol, Frédéric Landragin, Serge Heiden. Interoperable annotation of (co)references in the Democrat project. Thirteenth Joint ISO-ACL Workshop on Interoperable Semantic Annotation, ACL Special Interest Group on Computational Semantics (SIGSEM); ISO TC 37/SC 4 (Language Resources) WG 2, Sep 2017, Montpellier, France. ⟨hal-01583527v2⟩
  • Matthieu Decorde, Céline Guillot, Serge Heiden, Matthieu Quignard. Chaînes de référence, structuration textuelle et genres textuels en diachronie : premières explorations du corpus Democrat. Journée d’étude « Référence, coréférence et structure textuelle », Nov 2017, Lyon, France. ⟨hal-01680577⟩
  • Alexei Lavrentiev, Serge Heiden, Matthieu Decorde. Building an Open Morphological Lexicon and Lemmatizing Old French Texts with the TXM Platform. Corpus linguistics - 2017, St-Petersburg State University; Institute for Linguistic Studies (RAS); Herzen State Pedagogical University of Russia, Jun 2017, St-Pétersbourg, Russia. pp.48-52. ⟨halshs-01591122⟩
  • Bénédicte Pincemin, Damon Mayaffre, Serge Heiden, Philippe Weyl. Génétique mémorielle. Shoah, mémoire et ADT. JADT 2016 - Statistical Analysis of Textual Data, Damon Mayaffre; Céline Poudat; Laurent Vanni; Véronique Magri; Peter Follette; Caroline Daire, Jun 2016, Nice, France. pp.495-506. ⟨hal-01361988⟩
  • Marine Béranger, Serge Heiden, Alexei Lavrentiev. Reengineering Akkadian Tablets with TEI and TXM for Linguistic Analysis. TEI Conference and Members' Meeting, Oct 2015, Lyon, France. pp.36. ⟨halshs-01318713⟩
  • Alexei Lavrentiev, Serge Heiden, Matthieu Decorde. Analyzing TEI encoded texts with the TXM platform. The Linked TEI: Text Encoding in the Web. TEI Conference and Members Meeting 2013, Oct 2013, Rome, Italy. ⟨halshs-01118120⟩
  • Yves-François Le Lay, Serge Heiden, Luc Merchez, Bénédicte Pincemin. Retour de pêche. Le métier de pêcheur à travers le discours des professionnels français du Lac Léman. Colloque international "Corpus de textes : composer, mesurer, interpréter", Laboratoire junior Des nombres et des mots (N&Ms), ENS de Lyon, Jun 2013, Lyon, France. ⟨halshs-01372580⟩
  • Alexei Lavrentiev, Serge Heiden. The TXM Portal Software giving access to Old French Manuscripts Online. 7th International Conference on Language Resources and Evaluation (LREC), May 2012, Istanbul, Turkey. pp.29-35. ⟨halshs-00759361⟩
  • Alexei Lavrentiev, Serge Heiden. Constructing Analytic Data Categories for Corpus Analysis from TEI encoded sources. Text Encoding Initiative Conference 2012, Nov 2012, College Station, TX, United States. ⟨halshs-00808449⟩
  • Alexei Lavrentiev, Serge Heiden. TEI P5 Manuscript Transcriptions as a Resource for Linguistic Research. TEI Applied: Digital Texts and Language Resources, Nov 2010, Zadar, Croatia. ⟨halshs-00620103⟩
  • Bénédicte Pincemin, Serge Heiden, Marie-Hélène Lay, Jean-Marc Leblanc, Jean-Marie Viprey. Fonctionnalités textométriques : proposition de typologie selon un point de vue utilisateur. Dixièmes Journées internationales d'Analyse Statistique des données Textuelles, 2010, Rome, Italie. pp.341-353. ⟨halshs-00856446⟩
  • Serge Heiden. The TXM Platform : Building Open-Source Textual Analysis Software Compatible with the TEI Encoding Scheme. 24th Pacific Asia Conference on Language, Information and Computation, Nov 2010, Sendai, Japan. pp.389‑398. ⟨halshs-00549764⟩
  • Serge Heiden, Jean-Philippe Magué, Bénédicte Pincemin. TXM : Une plateforme logicielle open-source pour la textométrie - conception et développement. 10th International Conference on the Statistical Analysis of Textual Data - JADT 2010, Jun 2010, Rome, Italie. pp.1021-1032. ⟨halshs-00549779⟩
  • Sylvain Loiseau, Jean-Philippe Magué, Serge Heiden. The TextometrieR package: textual data analysis for social sciences and humanities. useR!, Jul 2009, Rennes, France. pp.En ligne. ⟨halshs-00984192⟩
  • Serge Heiden. La modélisation des phénomènes linguistiques. Atelier ATHIS IV (IVe Atelier Informatique et Histoire), l'informatique et l'utilisation des statistiques par les historiens, Sep 2007, Lyon, France. ⟨halshs-00377553⟩
  • Serge Heiden. Un modèle de données pour la textométrie : contribution à une interopérabilité entre outils. 8es Journées internationales d'analyse statistique des données textuelles, Apr 2006, Besançon, France. pp.487-498. ⟨halshs-00355449⟩
  • Serge Heiden. Atelier numérique pour l'historien : les différents niveaux d'observables automatiques. Colloque de l'École Doctorale d'Histoire de Paris I, Oct 2006, Paris, France. ⟨halshs-00377545⟩
  • Serge Heiden. Les logiciels de traitement informatique du texte, table ronde animée par Alain Dallo (LAMOP). ATHIS II, IIe Atelier Informatique et Histoire, l'historien, le texte et l'ordinateur, Nov 2006, Lyon, France. ⟨halshs-00377552⟩
  • Serge Heiden. Interface hypertextuelle à un espace de cooccurrences : implémentation dans Weblex : Actes des 7ième Journées internationales d'Analyse Statistique des Données Textuelles (JADT'04) "Le poids des mots", vol 1. 7ième Journées internationales d'Analyse Statistique des Données Textuelles (JADT'04), Mar 2004, Louvain-la-Neuve, Belgique. pp.577-588. ⟨halshs-00381011⟩
  • Serge Heiden. Illustration d'une méthode lexicométrique des cooccurrences sur un corpus historique. Société des études robespierristes - Journée d'études du 23 novembre 2002 (Sorbonne), 2003, Paris, France. pp.105-122. ⟨halshs-00151844⟩
  • Serge Heiden, Céline Guillot. Capitalisation des savoirs par le web : une application de la TEI pour l'encodage et l'exploitation des textes de la Base de Français Médiéval. colloque d'Ottawa, 4-5 oct. 2002, 2003, Ottawa, Canada. pp.77-92. ⟨halshs-00151843⟩
  • Serge Heiden, Maurice Tournier. Lexicométrie textuelle, sens et stratégie discursive. Simposio internacional de análisis del discurso, 2001, Madrid, Espagne. pp.2287-2300. ⟨halshs-00151838⟩
  • Sophie Prévost, Serge Heiden, Fernande Dupuis. Catégorisation d'un corpus hétérogène de français médiéval. Actes du colloque ‘JADT 2000 : 5es Journées Internationales d'Analyse Statistique des Données Textuelles' Lausanne, 2000, 2000, p. 485-492. ⟨halshs-00087770⟩
  • Serge Heiden, Lamria Chetouani. Méthode des cooccurrences : recherche sémantique sur le nom propre. 5e journées internationales d'Analyse Statistiques des Données Textuelles (JADT'2000), 2000, Pagination non précisée. ⟨halshs-00151842⟩
  • Serge Heiden, Pierre Lafon, Gabriel Illouz, Benoît Habert, Serge Fleury, et al.. Prendre Le Monde en main : choix d'architecture. RIAO 2000, 2000, Pagination non précisée. ⟨halshs-00151840⟩
  • Serge Heiden, Sophie Prévost, Benoît Habert, Helka Folch, Serge Fleury, et al.. TyPTex : Inductive typological text classification by multivariate statistical analysis for NLP systems tuning/evaluation. Maria Gavrilidou, George Carayannis, Stella Markantonatou, Stelios Piperidis, Gregory Stainhaouer (éds) Second International Conference on Language Resources and Evaluation, 2000, p. 141-148. ⟨halshs-00087993⟩
  • Serge Heiden, Sophie Prévost, Benoît Habert, Gabriel Illouz, Pierre Lafon, et al.. Profilage de textes : un cadre de travail et une expérience. JADT'2000, 2000, Lausanne, Suisse. Pagination non précisée. ⟨halshs-00151839⟩
  • Serge Heiden, Pierre Lafon, Gabriel Illouz, Benoît Habert, Serge Fleury, et al.. Maîtriser les déluges de données hétérogènes. 1999, Cargèse, Italie. pp.37-46. ⟨halshs-00151841⟩

Ouvrage (y compris édition critique et traduction)1 document

  • Dominique Lagorgette, Pierre Larrivée, Céline Guillot, Alexei Lavrentiev, Bénédicte Pincemin, et al.. Représentations du sens linguistique 5. Université de Savoie, Laboratoire Langages, Littératures, Sociétés, 378 p., 2013, Langages, Frédéric Turpin, 978-2-919732-15-9. ⟨hal-00985723⟩

Chapitre d'ouvrage8 documents

  • Damon Mayaffre, Bénédicte Pincemin, Serge Heiden, Philippe Weyl. L'évolution de la mémoire de la Shoah au prisme de la statistique textuelle. Denis Peschanski; Brigitte Sion. La vérité du témoin, 2, Hermann Éditeurs; Institut National de l’Audiovisuel, pp.93-124, 2018, Mémoire et mémorialisation, 9782705697365. ⟨hal-01890536⟩
  • Céline Guillot-Barbance, Alexei Lavrentiev, Serge Heiden, Bénédicte Pincemin. Diachronie de l'oral représenté : délimitation et segmentation interne du dialogue (IXe-XVe siècle). Wendy Ayres-Benett; Anne Carlier; Julie Glikman; Thomas Rainsford; Gilles Siouffi; Carine Skupien Dekens. Nouvelles voies d’accès au changement linguistique. Actes du colloque de la SIDF, Classiques Garnier, pp.279-296, 2018, Nouvelles voies d’accès au changement linguistique. Actes du colloque de la SIDF, ⟨10.15122/isbn.978-2-406-06946-1.p.0279⟩. ⟨halshs-01313822⟩
  • Céline Guillot, Alexei Lavrentiev, Thomas Rainsford, Christiane Marchello-Nizia, Serge Heiden. La " philologie numérique " : tentative de définition d'un nouvel objet éditorial. Richard Trachsler; Frédéric Duval; Lino Leonardi. Actes du XXVIIe Congrès international de linguistique et de philologie romanes (Nancy, 15-20 juillet 2013). Section 13 : Philologie textuelle et éditoriale, ATILF/SLR, pp.143-154, 2017, 979-10-91460-29-3. ⟨halshs-00846767⟩
  • Yves-François Le Lay, Serge Heiden, Luc Merchez, Bénédicte Pincemin. Retour de pêche: Le métier de pêcheur à travers le discours des professionnels français du lac Léman. Corpus de textes : composer, mesurer, interpréter, ENS Editions, pp.117-134, 2016, 978-2-84788-827-0. ⟨10.4000/books.enseditions.7360⟩. ⟨halshs-01423605⟩
  • Céline Guillot, Serge Heiden, Alexei Lavrentiev, Bénédicte Pincemin. L'oral représenté dans un corpus de français médiéval (9e-15e) : approche contrastive et outillée de la variation diasystémique. Kirsten Jeppesen Kragh; Jan Lindschouw. Les variations diasystémiques et leurs interdépendances dans les langues romanes. Actes du Colloque DIA II à Copenhague (19-21 nov. 2012), Éditions de linguistique et de philologie, pp.15-28, 2015, 9782372760027. ⟨halshs-00760647v2⟩
  • Céline Guillot, Alexei Lavrentiev, Bénédicte Pincemin, Serge Heiden. Le discours direct au Moyen Âge : vers une définition et une méthodologie d'analyse. Dominique Lagorgette ; Pierre Larrivée. Représentations du sens linguistique 5, Université de Savoie, pp.17-41, 2013, Langages, 14, 9782919732159. ⟨halshs-00820262⟩
  • Serge Heiden, Sophie Prévost. ETIQUETAGE d'un CORPUS HETEROGENE de FRANÇAIS MEDIEVAL: ENJEUX et MODALITES. C.D. Pusch et W. Raible. Romance Corpus Linguistics - Corpora and Spoken Language, Tübingen, Gunter Narr Verlag Tübingen, p. 127-136, 2002. ⟨halshs-00087995⟩
  • Lamria Chetouani, Heiden Serge. Sémantique des noms propres. Méthode des cooccurrences. M. Rajman & J-C. Chappelier. JADT 2000. 5èmes Journées internationales d'Analyse statistique des Données Textuelles, n°2, Ecole Polytechnique de Lausanne (EPA), pp. 575-578, 2000. ⟨halshs-01160786⟩

Direction d'ouvrage, Proceedings, Dossier3 documents

  • Serge Heiden, Bénédicte Pincemin. JADT 2008. Presses universitaires de Lyon, pp.1198, 2008. ⟨halshs-00377521⟩
  • Céline Guillot, Serge Heiden, Alexei Lavrentiev, Christiane Marchello-Nizia. Constitution et exploitation des corpus d'ancien français et de moyen français [N° 7 de : Corpus ]. Université de Nice-Sophia Antipolis, pp.252, 2008. ⟨halshs-00353838⟩
  • Céline Guillot, Serge Heiden, Sophie Prévost. A la quête du sens : études littéraires, historiques et linguistiques en hommage à Christiane Marchello-Nizia. ENS Éditions, pp.364, 2006. ⟨halshs-00324172⟩

Autre publication1 document

Pré-publication, Document de travail1 document

  • Serge Heiden, Bénédicte Pincemin. Guide de transcription d'entretien avec Transcriber pour TXM. 2011. ⟨halshs-01341955⟩

Logiciel1 document