Keywords

Co-authors

Researcher identifiers

Export Publications

Export the displayed publications:
Number of documents

66

Lydia-Mai Ho-Dac, University of Toulouse, CLLE-ERSS


Associate Professor of linguistics, University of Toulouse, CLLE-ERSS

Computational linguistics, Natural Language Processing, Corpus Linguistics, Discourse structures and textual organization

-------

Maître de conférences en Sciences du langage, Université de Toulouse, CLLE-ERSS

Linguistique computationnelle, Traitement Automatique des Langues, Linguistiques de corpus, structures discursives et organisation textuelle


Journal articles9 documents

  • Céline Poudat, Lydia-Mai Ho-Dac. Désaccords et conflits dans le Wikipédia francophone. CORELA - COgnition, REprésentation, LAngage, CERLICO-Cercle Linguistique du Centre et de l'Ouest (France), A paraître, Accord et non accord, 31. ⟨hal-02048990⟩
  • Marie-Paule Péry-Woodley, Lydia-Mai Ho-Dac, Josette Rebeyrolle, Ludovic Tanguy, Cécile Fabre. A corpus-driven approach to discourse organisation: from cues to complex markers . Dialogue & Discourse, Bielefeld : Dialogue and Discourse Board of Editors, 2017, 8, pp.66 - 105. ⟨10.5087/dad.2017.103⟩. ⟨halshs-01483800⟩
  • Claudine Garcia-Debanc, Lydia-Mai Ho-Dac, Myriam Bras, Josette Rebeyrolle. Vers l'annotation discursive de textes d'élèves. Corpus, Bases, Corpus, Langage - UMR 7320, 2017, 16, pp.157-184. ⟨http://corpus.revues.org/⟩. ⟨hal-01558836⟩
  • Lydia-Mai Ho-Dac, Julie Lemarié, Marie-Paule Péry-Woodley, Marianne Vergez-Couret. Multidisciplinary Perspectives on Signalling Text Organisation: Introduction to the Special Issue. Discours - Revue de linguistique, psycholinguistique et informatique, Laboratoire LATTICE, 2012, 10, http://discours.revues.org/8598. ⟨hal-00730361⟩
  • Lydia-Mai Ho-Dac, Cécile Fabre, Marie-Paule Péry-Woodley, Josette Rebeyrolle, Ludovic Tanguy. An empirical approach to the signalling of enumerative structures. Discours - Revue de linguistique, psycholinguistique et informatique, Laboratoire LATTICE, 2012, 10, (publication en ligne). ⟨halshs-00954182⟩
  • Ludovic Tanguy, Cécile Fabre, Lydia-Mai Ho-Dac, Josette Rebeyrolle. Caractérisation des échanges entre patients et médecins : approche outillée d'un corpus de consultations médicales. Corpus, 2011, 10, pp.137-154. ⟨halshs-00953406⟩
  • Lydia-Mai Ho-Dac, Anne Küppers. La subjectivité à travers les médias : étude comparée de les médias participatifs et de la presse traditionnelle. Corpus, 2011, 10, pp.179-199. ⟨hal-00976367⟩
  • Marie-Paule Péry-Woodley, Stergos Afantenos, Lydia-Mai Ho-Dac, Nicholas Asher. La ressource ANNODIS, un corpus enrichi d'annotations discursives. Traitement Automatique des Langues, ATALA, 2011, 52 (3), pp.71-101. ⟨halshs-00935201⟩
  • Lydia-Mai Ho-Dac, Marie-Paule Péry-Woodley. A data-driven study of temporal adverbials as discourse segmentation markers. Discours - Revue de linguistique, psycholinguistique et informatique, Laboratoire LATTICE, 2009, 4, http://discours.revues.org/5952. ⟨10.4000/discours.5952⟩. ⟨hal-00979739⟩

Conference papers43 documents

  • Lydia-Mai Ho-Dac, Mélanie Jucla. évolex: à la croisée du TAL et de la psycholinguistique. Cepel, Cercle Étudiant Pour l'Étude du Langage, Feb 2019, Toulouse, France. ⟨hal-02047636⟩
  • Lydia-Mai Ho-Dac, Aleksandra Miletic. Évaluation du caractère sous-spécifié des Noms Sous-Spécifiés. Les noms sous-spécifiés en français : du lexique au discours, Nov 2018, Toulouse, France. ⟨hal-02047663⟩
  • Claire Doquet, Lydia-Mai Ho-Dac, Marie-Paule Jacques, Claude Ponton. Structuration d’une ressource pour l’étude de l’écriture à différents moments de la scolarisation.. Journées d’études Méthodes d’analyse et de traitement des textes d’élèves, SFR AEF, laboratoire CLLE, laboratoire PLH, Oct 2018, Toulouse, France. ⟨hal-01910664⟩
  • Lydia-Mai Ho-Dac. Metadata and interactional features in the WikiDisc Corpus. Fostering linguistic studies on Wikipedia discussions. Multilingual corpus building, annotation and exploration tools, Jul 2018, Nice, France. ⟨hal-02048839⟩
  • Xavier de Boissezon, Lola Danet, Cécile Fabre, Jérôme Farinas, Bruno Gaume, et al.. EVOLEX: un terrain pour éprouver les modèles et techniques TAL de mesures de proximité sémantique. Qui-­‐Quoi-­‐Où de la recherche sur langage, culture & société à Toulouse, May 2018, Toulouse, France. ⟨hal-02048841⟩
  • Xavier de Boissezon, Lola Danet, Cécile Fabre, Jérôme Farinas, Bruno Gaume, et al.. EVOLEX: un terrain pour éprouver les modèles et techniques TAL de mesures de proximité sémantique. Qui-­‐Quoi-­‐Où de la recherche sur langage, culture & société à Toulouse, May 2018, Toulouse, France. ⟨hal-02048840⟩
  • Bruno Gaume, Ludovic Tanguy, Cécile Fabre, Lydia-Mai Ho-Dac, Bénédicte Pierrejean, et al.. Automatic analysis of word association data from the Evolex psycholinguistic tasks using computational lexical semantic similarity measures. 13th International Workshop on Natural Language Processing and Cognitive Science (NLPCS), Sep 2018, Krakow, Poland. ⟨hal-01881336⟩
  • Lydia-Mai Ho-Dac, Cécile Fabre, Anouk Birski, Imane Boudraa, Aline Bourriot, et al.. LITL at CLEF eHealth2017: automatic classication of death reports. CLEF eHealth 2017, Sep 2017, Dublin, Ireland. ⟨hal-01702705⟩
  • Michael Beißwenger, Ciara Wigham, Carole Etienne, Darja Fišer, Holger Grumt Suárez, et al.. Connecting Resources: Which Issues Have to be Solved to Integrate CMC Corpora from Heterogeneous Sources and for Different Languages?. 5th Conference on CMC and Social Media Corpora for the Humanities (cmccorpora17), Oct 2017, Bolzano, Italy. pp.52-55. ⟨hal-01918880⟩
  • Céline Poudat, Camille Bouzereau, Lydia-Mai Ho-Dac. Désaccords et conflits dans le Wikipédia francophone. Colloque CerLICO, « Accord, non accord et… désaccord », Jun 2017, Poitiers, France. ⟨hal-02048838⟩
  • Lydia-Mai Ho-Dac. French Wikipedia Corpus The WikiTalk Corpus. Integrating a new type of language resource into the Digital Humanities landscape: French-German colloquium on standards for corpora of computer-mediated communication, Jun 2017, Essen, Germany. ⟨hal-02048843⟩
  • Lydia-Mai Ho-Dac, Sophie Muller, Valentine Delbar. L'anti­correcteur : outil d'évaluation positive de l'orthographe et de la grammaire. Conférence conjointe JEP-TALN-RECITAL, Jul 2016, Paris, France. pp.333-341. ⟨hal-01378351⟩
  • Lydia-Mai Ho-Dac, Veronika Laippala, Céline Poudat, Ludovic Tanguy. French Wikipedia Talk Pages: Profiling and Conflict Detection. 4th Conference on CMC and Social Media Corpora for the Humanities, Sep 2016, Ljubljana, Slovenia. ⟨hal-01378349⟩
  • Lydia-Mai Ho-Dac, Ludovic Tanguy, Céline Grauby, Aurore Heu Mby, Justine Malosse, et al.. LITL at CLEF eHealth2016: recognizing entities in French biomedical documents. CLEF eHealth 2016, Sep 2016, Évora, Portugal. ⟨hal-01365928⟩
  • Claudine Garcia-Debanc, Karine Bonnemaison, Josette Rebeyrolle, Myriam Bras, Lydia-Mai Ho-Dac, et al.. Problèmes méthodologhiques posés par l'annotation discursives de textes d'élèves.. Journée d'études du groupe Ecriture Scolaire (laboratoire CLESTHIA, Paris 3) : Analyser informatiquement des grands corpus d'écrits scolaires : problèmes de transcription, d'annotation et de traitement, Mar 2015, Paris, France. ⟨hal-01326830⟩
  • Lydia-Mai Ho-Dac, Veronika Laippala. Les discussions Wikipedia : un corpus pour caractériser le genre « discussion ». International Research Days: Social Media and CMC Corpora for the eHumanities, ATALA; Université de Rennes, Oct 2015, Rennes, France. ⟨hal-01271648⟩
  • Lydia-Mai Ho-Dac. Échanger sur sa santé : apport de la linguistique pour l'analyse des forums de santé. Séminaire du Cercle Etudiant pour l'Etude du Langage (CEPEL), Feb 2015, Toulouse, France. ⟨hal-01133434⟩
  • Nathalie Bricon-Souf, Ghazar Chahbandarian, Lydia-Mai Ho-Dac, Mustapha Mojahid. Un cadre fédérateur de représentation des données et indices issus des forum de santé. Atelier SIIM 2015 (Conférence IC 2015), Jun 2015, Rennes, France. ⟨hal-01271624⟩
  • Lydia-Mai Ho-Dac, Marie-Paule Péry-Woodley. Annotation des structures discursives : l'expérience ANNODIS. 4e Congrès Mondial de Linguistique Française (CMLF 2014), Jul 2014, Berlin, Germany. pp.2647 - 2661, ⟨10.1051/shsconf/20140801286⟩. ⟨hal-01068119⟩
  • Cécile Fabre, Nabil Hathout, Lydia-Mai Ho-Dac, François Morlane-Hondère, Philippe Muller, et al.. Présentation de l'atelier SemDis 2014 : sémantique distributionnelle pour la substitution lexicale et l'exploration de corpus spécialisés. 21e Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2014), Jun 2014, Marseille, France. pp.196-205. ⟨hal-01022216⟩
  • Lydia-Mai Ho-Dac. L'expérience ANNODIS. Consortium "Corpus écrits", annotations de haut niveau, Jan 2013, Paris, France. ⟨hal-00983366⟩
  • Lydia-Mai Ho-Dac. Combiner position initiale et position textuelle pour accéder à l'organisation textuelle. Journée d'étude "Commencer", May 2013, Lyon, France. ⟨hal-00983033⟩
  • Lydia-Mai Ho-Dac, Halima Sahraoui. AphasiaBank : une base de données translinguistique de corpus aphasiques. International conference: NeuroPsychoLinguistic Perspectives on Aphasia, Toulouse, 21-23 juin 2012., Jun 2012, Toulouse, France. ⟨hal-02048994⟩
  • Lydia-Mai Ho-Dac, Ludovic Tanguy. Identification des marqueurs complexes des structures multi-échelles. Journée d'étude "Les structures énumératives dans le discours", 2012, Toulouse, France. ⟨halshs-00953728⟩
  • Lydia-Mai Ho-Dac, Marie-Paule Péry-Woodley. ANNODIS : une ressource pour l'identification de systèmes de marqueurs du discours. Discours et TAL : des modèles linguistiques aux applications -- JAD'12, Journée d'étude organisée sous l'égide de l'ATALA et de la revue Discours, May 2012, Paris, France. ⟨hal-00983374⟩
  • Stergos Afantenos, Nicholas Asher, Farah Benamara, Myriam Bras, Cécile Fabre, et al.. An empirical resource for discovering cognitive principles of discourse organisation: the ANNODIS corpus. Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12), May 2012, Istanbul, Turkey. ⟨hal-00976087⟩
  • Lydia-Mai Ho-Dac, Marie-Paule Péry-Woodley. Mise en pratique pour l'écrit : Expérience d'annotation discursive de textes écrits. école thématique CNRS : annotation de données langagières, Sep 2011, Biarritz, France. ⟨hal-00983384⟩
  • Anne Küppers, Lydia-Mai Ho-Dac. Un corpus de presse francophone pour l'étude de l'impact d'Internet sur les pratiques langagières. CJC Praxiling : Corpus, données, modèles : approches qualitatives et quantitatives, May 2011, Montpellier, France. ⟨hal-00983456⟩
  • Lydia-Mai Ho-Dac, Cécile Fabre, Marie-Paule Péry-Woodley, Josette Rebeyrolle, Ludovic Tanguy. High-level discourse structures: topical chains and enumerative structures in a diversified annotated corpus. Corpus Linguistics, 2011, Birmingham, United Kingdom. ⟨halshs-00953561⟩
  • Lydia-Mai Ho-Dac, Anne Küppers. Does Internet initiate new genres? the case of printed newspapers, their online versions and citizen press. IVACS 2010 : Connecting Corpus Linguistics, Jun 2010, Edinburgh, United Kingdom. ⟨hal-00983059⟩
  • A. Küppers, Lydia-Mai Ho-Dac. Private State in Public Media: Subjectivity in French Traditional and Online News. 1st Workshop on Computational Approaches to Subjectivity and Sentiment Analysis (WASSA), ECAI 2010, Aug 2010, Lisbon, Portugal. pp.22-29. ⟨hal-00983040⟩
  • Lydia-Mai Ho-Dac, Marie-Paule Péry-Woodley, Ludovic Tanguy. Anatomie des Structures Énumératives. Traitement Automatique des Langues Naturelles, 2010, Montréal, Canada. (publication numérique). ⟨halshs-00509189⟩
  • Lydia-Mai Ho-Dac, Cécile Fabre, Marie-Paule Péry-Woodley, Josette Rebeyrolle. On the signalling of multi-level discourse structures. MAD 2010 (Multidisciplinary Approaches to Discourse) : Multidisciplinary Perspectives on Signalling Text Organisation, Mar 2010, Moissac, France. pp.94-105. ⟨hal-00979750⟩
  • M.P. Péry-Woodley, N. Asher, P. Enjalbert, F. Benamara, M. Bras, et al.. ANNODIS: une approche outillée de l'annotation de structures discursives. Traitement Automatique des Langues Naturelles 2009, 2009, Unknown, Unknown Region. ⟨hal-01231930⟩
  • Lydia-Mai Ho-Dac, Cécile Fabre, Marie-Paule Péry-Woodley, Josette Rebeyrolle. A top-down approach to discourse-level annotation. Corpus linguistics conference, Jul 2009, Liverpool, United Kingdom. ⟨hal-00982871⟩
  • Lydia-Mai Ho-Dac, Cécile Fabre, Marie-Paule Péry-Woodley, Josette Rebeyrolle. Corpus annotation of macro discourse structures. 1st International conference on corpus linguistics (CILC-09), May 2009, Murcia, Spain. ⟨hal-00976352⟩
  • Lydia-Mai Ho-Dac, Cécile Fabre, Marie-Paule Péry-Woodley, Josette Rebeyrolle. Des indices aux marqueurs : méthodes de découverte de marqueurs discursifs complexes. Linguistic and Psycholinguistic Approaches to Text Structuring, Sep 2009, Paris, France. ⟨hal-00982862⟩
  • Marie-Paule Péry-Woodley, Nicholas Asher, Patrice Enjalbert, Farah Benamara, Myriam Bras, et al.. ANNODIS : une approche outillée de l'annotation de structures discursives. TALN 2009 (Conférence sur le Traitement Automatique des Langues Naturelles), Jun 2009, Senlis, France. paper_TALN_52. ⟨hal-00410590⟩
  • Cécile Fabre, Josette Rebeyrolle, Lydia-Mai Ho-Dac. Examen du statut des syntagmes prépositionnels à la lumière de données issues de corpus annotés. Congrès Mondial de Linguistique Française, Jul 2008, Paris, France. pp.2484-2494, ⟨10.1051/cmlf08227⟩. ⟨hal-00559912⟩
  • Christian Jacquemin, Lydia-Mai Ho-Dac, Brigitte Grau, Massih-Reza Amini, Patrick Gallinari. Appréhender dynamiquement les textes à plusieurs niveaux de détail. Colloque Société de l'Information, May 2005, Lyon, France. pp.1-6. ⟨hal-01491830⟩
  • Lydia-Mai Ho-Dac, Cécile Frérot. Approche discursive et approche syntaxique des circonstants en corpus. Jun 2004. ⟨sic_00001226⟩
  • Marie-Paule Jacques, Josette Rebeyrolle, Lydia-Mai Ho-Dac. Quelques aspects méthodologiques d'une étude de la fonction discursive des titres en corpus. Jun 2004. ⟨sic_00001227⟩
  • Frédérik Bilhaut, Lydia-Mai Ho-Dac, Andrée Borillo, Thierry Charnois, Patrice Enjalbert, et al.. Indexation discursive pour la navigation intradocumentaire : cadres temporels et spatiaux dans l'information géographique. Actes de la 10e Conférence Traitement Automatique du Langage Naturel (TALN'03), 2003, France. pp.315-320. ⟨hal-00324717⟩

Poster communications3 documents

  • Claire Doquet, Silvia Federzoni, Serge Fleury, Lydia-Mai Ho-Dac, Sara Mazziotti, et al.. The É:Calm Resource: Transcription, Encoding and Annotation of Handwritten Manuscripts produced by French Pupils and Students. Annotation of non-standard corpora: Prospects and challenges, Sep 2019, Bamberg, Germany. ⟨hal-02291192⟩
  • Xavier de Boissezon, Lola Danet, Cécile Fabre, Jérôme Farinas, Bruno Gaume, et al.. EVOLEX : approches psycholinguistique et computationnelle de l'accès au lexique et de la proximité sémantique entre paires de mots. FORUM À LA CROISÉE DES SCIENCES : Interagissez, Imaginez, Innovez - FACS3I, Jan 2019, Toulouse, France. ⟨hal-02047651⟩
  • Lydia-Mai Ho-Dac, Céline Poudat. Corpus DiscoWiki: Un corpus de Discussions Conflictuelles du Wikipédia francophone. Journée d'étude CORLI : Traitements et standardisation des corpus multimodaux et web 2.0., May 2018, Paris, France. ⟨hal-01873824⟩

Book sections4 documents

  • Lydia-Mai Ho-Dac, Veronika Laippala. Le corpus WikiDisc : ressource pour la caractérisation des discussions en ligne. Wigham, Ciara R.; Ledegen, Gudrun. Corpus de communication médiée par les réseaux : construction, structuration, analyse., l'Harmattan, pp.107-124, 2017, Humanités numériques, 978-2-343-11212-1. ⟨http://www.editions-harmattan.fr/⟩. ⟨halshs-01488029⟩
  • Lydia-Mai Ho-Dac, Veronika Laippala, Céline Poudat, Ludovic Tanguy. Exploring Wikipedia talk pages for conflict detection. Darja Fišer and Michael Beißwenger. Investigating Computer-Mediated Communication: Corpus-Based Approaches to Language in the Digital World, Ljubljana University Press, Faculty of Arts, pp.146-168, 2017, Translation Studies and Applied Linguistics, 978-961-237-961-2. ⟨10.4312/9789612379612⟩. ⟨http://www.ff.uni-lj.si/sites/default/files/Dokumenti/Knjige/e-books/investigating.pdf⟩. ⟨hal-01678227⟩
  • Nicholas Asher, Philippe Muller, Myriam Bras, Lydia-Mai Ho-Dac, Farah Benamara, et al.. ANNODIS and related projects: case studies on the annotation of discourse structure. Nancy Ide; James Pustejovsky. Handbook of Linguistic Annotation, ⟨ Springer Netherlands⟩, pp.1241-1264, 2017, 978-94-024-0881-2. ⟨10.1007/978-94-024-0881-2_47⟩. ⟨hal-01678212⟩
  • Lydia-Mai Ho-Dac. An exploratory data-driven analysis for describing discourse organization. Almela Moisés and Aquilino Sánchez. A Mosaic of Corpus Linguistics. Selected Approaches, Frankfurt/Berlin: Peter Lang, pp.79--100, 2010, Studien zur romanischen Sprachwissenschaft und interkulturellen Kommunikation, 978-3-631-58789-8 hb. ⟨hal-00976346⟩

Directions of work or proceedings3 documents

  • Lydia-Mai Ho-Dac, Philippe Muller. Cross-Linguistic Discourse Annotation: applications and perspectives. TextLink2018 -- Final Action Conference. 2018. ⟨hal-02048987⟩
  • Lydia-Mai Ho-Dac, Julie Lemarié, Marie-Paule Péry-Woodley, Marianne Vergez-Couret. Multidisciplinary Perspectives on Signalling Text Organisation: Introduction to the Special Issue.. France. 2012, Discours, ⟨10.4000/discours.8598 ⟩. ⟨http://discours.revues.org/8598⟩. ⟨hal-00983435⟩
  • Lydia-Mai Ho-Dac, Julie Lemarié, Marie-Paule Péry-Woodley, Marianne Vergez-Couret. Proceedings of the 8th MAD Multidisciplinary Perspectives on Signalling Text Organisation. Lydia-Mai Ho-Dac; Julie Lemarié; Marie-Paule Péry-Woodley; Marianne Vergez-Couret. MAD Multidisciplinary Perspectives on Signalling Text Organisation, Mar 2010, Moissac, France. 2010. ⟨hal-01391515⟩

Reports1 document

  • Maud Colléter, Cécile Fabre, Lydia-Mai Ho-Dac, Marie-Paule Péry-Woodley, Josette Rebeyrolle, et al.. La ressource ANNODIS multi-échelle : guide d'annotation et bonus. 2012. ⟨hal-00983076⟩

Theses1 document

  • Lydia-Mai Ho-Dac. La position initiale dans l'organisation du discours :
    une exploration en corpus. Linguistique. Université Toulouse le Mirail - Toulouse II, 2007. Français. ⟨tel-00176747v3⟩

Lectures2 documents

  • Lydia-Mai Ho-Dac. LimeSurvey - prise en main. Master. France. 2018. ⟨cel-02021073⟩
  • Lydia-Mai Ho-Dac. Profiling interactions behind the Wikipedia articles. Master. Finland. 2018. ⟨cel-02047660⟩