Accéder directement au contenu

Gaël Lejeune

63
Documents

Présentation

Pour des informations complètes, mon site personnel : <http://lejeunegael.fr/>

Publications

Exploiter un corpus de données textuelles sans post-traitement : l’écriture burlesque de la Fronde

Karine Abiven , Gaël Lejeune , Jean-Baptiste Tanguy
Humanités numériques, 2021, Revue Humanités numériques (n° 4)
Article dans une revue hal-03500616v1
Image document

Sarcasm and Sentiment Detection in Arabic: Investigating the Interest of Character-level Features

Dhaou Ghoul , Gaël Lejeune
ACL Anthology, 2021
Article dans une revue hal-03208134v1
Image document

Out-of-the-Box and Into the Ditch? Multilingual Evaluation of Generic Text Extraction Tools

Adrien Barbaresi , Gaël Lejeune
Language Resources and Evaluation Conference (LREC 2020), 2020, pp.5-13
Article dans une revue hal-02732851v1

Analyse automatique de documents anciens : tirer parti d’un corpus incomplet, hétérogène et bruité

Karine Abiven , Gaël Lejeune
Recherche d’Information, Document et Web Sémantique, 2019, Vol 19 No 1 (2019): About Variety in Humanities Big Data, 2 (1), ⟨10.21494/ISTE.OP.2019.0335⟩
Article dans une revue hal-02467535v1
Image document

A New Proposal for Evaluating Web Page Cleaning Tools

Gaël Lejeune , Lichao Zhu
Computación y sistemas, 2018, ⟨10.13053/CyS-22-4-3062⟩
Article dans une revue hal-02467732v1

Multilingual Event Extraction for Epidemic Detection

Gaël Lejeune , Romain Brixtel , Antoine Doucet , Nadine Lucas
Artificial Intelligence in Medicine, 2015, 65 (2), pp.131--143. ⟨10.1016/j.artmed.2015.06.005⟩
Article dans une revue hal-01294127v1

Vers une approche « rhétorique » en TAL : application à la veille épidémiologique multilingue

Gaël Lejeune , Romain Brixtel , Christine Durieux
Revue SEPTET, 2013, [13 p.]
Article dans une revue hal-01074771v1
Image document

SPQR@Deft2023: Résolution automatique de QCM médicaux à partir de corpus de domaine et de mesures de similarité

Julien Bezançon , Toufik Boubehziz , Corina Chutaux , Oumaima Zine , Laurie Acensio
Actes du Défi Fouille de Textes@TALN2023, ATALA, Jun 2023, Paris, France. https://coria-taln-2023.sciencesconf.org/data/proceedings_DEFT.pdf
Communication dans un congrès hal-04131847v1
Image document

SPQR@Deft2023: Similarité Sorbonne Pour les Systèmes de Question Réponse

Julien Bezançon , Toufik Boubehziz , Corina Chutaux , Oumaima Zine , Laurie Acensio
18e Conférence en Recherche d'Information et Applications -- 16e Rencontres Jeunes Chercheurs en RI -- 30e Conférence sur le Traitement Automatique des Langues Naturelles -- 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, 2023, Paris, France. pp.11-22
Communication dans un congrès hal-04131579v1
Image document

Stylo@DEFT2022 : Notation automatique de copies d’étudiant·e·s par combinaisons de méthodes de similarité

Ibtihel Ben Ltaifa , Toufik Boubehziz , Andrea Briglia , Corina Chutaux , Yoann Dupont
Traitement Automatique des Langues Naturelles, 2022, Avignon, France. pp.11-22
Communication dans un congrès hal-03703281v1
Image document

Reconnaissance d'entités nommées sur des sorties OCR bruitées : des pistes pour la désambiguïsation morphologique automatique

Caroline Koudoro-Parfait , Gaël Lejeune , Richy Buth
Traitement Automatique des Langues Naturelles, 2022, Avignon, France. pp.45-55
Communication dans un congrès hal-03701476v1
Image document

Fine-tuning de modèles de langues pour la veille épidémiologique multilingue avec peu de ressources

Stephen Mutuvi , Emanuela Boros , Antoine Doucet , Adam Jatowt , Gaël Lejeune
Traitement Automatique des Langues Naturelles (TALN 2022), Jun 2022, Avignon, France. pp.345-354
Communication dans un congrès hal-03701516v1

X-COTE – Extraction de Contenus Textuels du Web

Adrien Barbaresi , Emmanuel Giguet , Gaël Lejeune
TALN-RECITAL 2021, Jun 2021, Lille, France
Communication dans un congrès hal-03382641v1
Image document

Étude comparative de méthodes de classification multilingue appliquées à l'épidémiologie

Stephen Mutuvi , Emanuela Boros , Antoine Doucet , Gaël Lejeune , Adam Jatowt
COnférence en Recherche d'Informations et Applications - CORIA 2021, French Information Retrieval Conference, Apr 2021, Grenoble (virtuel), France. ⟨10.5281/zenodo.4734472⟩
Communication dans un congrès hal-03320343v1
Image document

Daniel@FinTOC-2021: Taking Advantage of Images and Vectorial Shapes in Native PDF Document Analysis

Emmanuel Giguet , Gaël Lejeune
3rd Financial Narrative Processing Workshop, Sep 2021, Lancaster, United Kingdom. pp.70-74
Communication dans un congrès hal-03744586v1
Image document

Que recèlent les données textuelles issues du web ?

Adrien Barbaresi , Gaël Lejeune
6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). 2e atelier Éthique et TRaitemeNt Automatique des Langues (ETeRNAL), 2020, Nancy, France. pp.19-28
Communication dans un congrès hal-02750223v3
Image document

Daniel@FinTOC’2 Shared Task: Title Detection and Structure Extraction

Emmanuel Giguet , Gaël Lejeune , Jean-Baptiste Tanguy
1st Joint Workshop on Financial Narrative Processing and MultiLing Financial Summarisation @COLING’2020, Dec 2020, Barcelone, Spain
Communication dans un congrès hal-03024867v1
Image document

Dating Ancient texts: an Approach for Noisy French Documents

Anaëlle Baledent , Nicolas Hiebel , Gaël Lejeune
Language Resources and Evaluation Conference (LREC) 2020, May 2020, Marseille, France
Communication dans un congrès hal-02571633v1
Image document

Voting Classifier vs Deep learning method in Arabic Dialect Identification

Dhaou Ghoul , Gaël Lejeune
: Proceedings of the Fifth Arabic Natural Language Processing Workshop, COLING 2020, Dec 2020, Barcelone, Spain
Communication dans un congrès hal-03089957v1
Image document

Impact Analysis of Document Digitization on Event Extraction

Nhu Khoa Nguyen , Emanuela Boroş , Gaël Lejeune , Antoine Doucet
4th Workshop on Natural Language for Artificial Intelligence (NL4AI 2020) co-located with the 19th International Conference of the Italian Association for Artificial Intelligence (AI*IA 2020), Nov 2020, Virtual, Italy. pp.17-28
Communication dans un congrès hal-03026148v1
Image document

Bien choisir son outil d'extraction de contenu à partir du Web

Gaël Lejeune , Adrien Barbaresi
6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 4 : Démonstrations et résumés d'articles internationaux, Jun 2020, Nancy, France. pp.46-49
Communication dans un congrès hal-02768510v3
Image document

Multilingual Epidemiological Text Classification: A Comparative Study

Stephen Mutuvi , Emanuela Boros , Antoine Doucet , Gaël Lejeune , Adam Jatowt
COLING, International Conference on Computational Linguistics, Dec 2020, Barcelone, Spain. pp.6172-6183, ⟨10.18653/v1/2020.coling-main.543⟩
Communication dans un congrès hal-03089807v1
Image document

Calcul de similarité entre phrases : quelles mesures et quels descripteurs ?

Davide Buscaldi , Ghazi Felhi , Dhaou Ghoul , Josepth Le Roux , Gaël Lejeune
6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Atelier DÉfi Fouille de Textes, 2020, Nancy, France. pp.14-25
Communication dans un congrès hal-02784738v3
Image document

SinNer@Clef-Hipe2020 : Sinful adaptation of SotA models for Named Entity Recognition in French and German

Pedro Javier Ortiz Suárez , Yoann Dupont , Gaël Lejeune , Tian Tian
CLEF 2020 Working Notes. Working Notes of CLEF 2020 - Conference and Labs of the Evaluation Forum, Sep 2020, Thessaloniki / Virtual, Greece
Communication dans un congrès hal-02984746v1

Sociologie de l'Informatique et Informatique de la Sociologie

Gaël Lejeune , Hugo Jeaningros
Journée d'Etudes Sociologie et Informatique (SIBON), Jan 2020, Paris, France
Communication dans un congrès hal-02570351v1
Image document

A Dataset for Multi-lingual Epidemiological Event Extraction

Stephen Mutuvi , Antoine Doucet , Gaël Lejeune , Moses Odeo
Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020), May 2020, Marseille, France. pp.4139-4144
Communication dans un congrès hal-02732848v1

Analyse stylistique automatique : à la recherche d'indices efficaces et pertinents pour caractériser le style de Dumas

Anaëlle Baledent , Gaël Lejeune
Phraséologie et stylistique de la langue littéraire, Mar 2019, Erlangen, Allemagne
Communication dans un congrès hal-02939782v1
Image document

Daniel@FinTOC-2019 Shared Task : TOC Extraction and Title Detection

Emmanuel Giguet , Gaël Lejeune
The Second Financial Narrative Processing Workshop (FNP 2019), Sep 2019, Turku, Finland. pp.63-68
Communication dans un congrès hal-02303131v1
Image document

Indexation et appariements de documents cliniques pour le Deft 2019

Davide Buscaldi , Dhaou Ghoul , Joseph Le Roux , Gaël Lejeune
TALN -Défi Fouille de Textes (DEFT) 2019, Jul 2019, Toulouse, France
Communication dans un congrès hal-02467526v1

MICHAEL: Mining Character-level Patterns for Arabic Dialect Identification (MADAR Challenge)

Dhaou Ghoul , Gaël Lejeune
Proceedings of the Fourth Arabic Natural Language Processing Workshop, Aug 2019, Florence, France. pp.229-233, ⟨10.18653/v1/W19-4627⟩
Communication dans un congrès hal-02467486v1
Image document

Modèles en Caractères pour la Détection de Polarité dans les Tweets

Davide Buscaldi , Joseph Le Roux , Gaël Lejeune
Atelier DEFT 2018, May 2018, Rennes, France
Communication dans un congrès hal-01988907v1
Image document

Analyse Diachronique de Corpus : le cas du poker

Gaël Lejeune , Lichao Zhu
Journées d'Analyse statistique des Données Textuelles (JADT) 2018, Jun 2018, Rome, Italie
Communication dans un congrès hal-02467662v1
Image document

Tweetaneuse : Fouille de motifs en caractères et plongement lexical à l’assaut du deft 2017

Davide Buscaldi , Aude Grezka , Gaël Lejeune
24e Conférence sur le Traitement Automatique des Langues Naturelles (TALN) : Analyse d'opinion et langage figuratif dans des tweets, Jun 2017, Orléans, France. pp. 65-76
Communication dans un congrès hal-02362125v1

Character Based Pattern Mining for Neology Detection

Gaël Lejeune , Emmanuel Cartier
Proceedings of the First Workshop on Subword and Character Level Models in NLP, Sep 2017, Copenhagen, France. pp.25-30, ⟨10.18653/v1/W17-4103⟩
Communication dans un congrès hal-02467738v1

Intrinsic and Extrinsic Evalution of Web Page Cleaning

Gaël Lejeune
International Symposium on Web Algorithms, Jun 2016, Deauville, France
Communication dans un congrès hal-01639799v1
Image document

Highlighting Psychological Features for Predicting Child Interjections During Story Telling

Gaël Lejeune , François Rioult , Bruno Crémilleux
INTERSPEECH 2016, Aug 2016, San Francisco, United States. ⟨10.21437/Interspeech.2016-527⟩
Communication dans un congrès hal-01639793v1
Image document

Ambiguity Diagnosis for Terms in Digital Humanities

Béatrice Daille , Evelyne Jacquey , Gaël Lejeune , Luis Felipe Melo , Yannick Toussaint
Language Resources and Evaluation Conference, May 2016, Portorož, Slovenia
Communication dans un congrès hal-01423650v1
Image document

A stylometric approach for opinion mining

Gaël Lejeune , Frédéric Dumonceaux
Traitement Automatique des Langues Naturelles 2015, DEFT, Jun 2015, caen, France
Communication dans un congrès hal-01170000v1
Image document

Évaluation intrinsèque et extrinsèque du nettoyage de pages Web

Gaël Lejeune , Romain Brixtel , Charlotte Lecluze
Traitement Automatique des Langues Naturelles 2015, Jun 2015, Caen, France
Communication dans un congrès hal-01170005v1
Image document

Towards diagnosing ambiguity of candidate terms

Gaël Lejeune , Béatrice Daille
Traitement Automatique des Langues Naturelles 2015, Jun 2015, Caen, France
Communication dans un congrès hal-01169996v1
Image document

Apports de l'analyse automatique multilingue pour la veille épidémiologique

Gaël Lejeune , Romain Brixtel , Charlotte Lecluze , Antoine Doucet
Journées internationales d’Analyse statistique des Données Textuelles, Jun 2014, Paris, France
Communication dans un congrès hal-01075057v1

Any Language Early Detection of Epidemic Diseases from Web News Streams

Romain Brixtel , Gaël Lejeune , Antoine Doucet , Nadine Lucas
Healthcare Informatics (ICHI), 2013 IEEE International Conference on, Sep 2013, philadelphie, United States. pp.159 - 168, ⟨10.1109/ICHI.2013.94⟩
Communication dans un congrès hal-01073195v1
Image document

Added-Value of Automatic Multilingual Text Analysis for Epidemic Surveillance

Gaël Lejeune , Romain Brixtel , Charlotte Lecluze , Antoine Doucet , Nadine Lucas
14th Conference on Artificial Intelligence in Medicine, May 2013, Murcia, Spain. pp.284 - 294, ⟨10.1007/978-3-642-38326-7_40⟩
Communication dans un congrès hal-01074535v1
Image document

Détection de zones parallèles à l’intérieur de multi-documents pour l’alignement multilingue

Charlotte Lecluze , Romain Brixtel , Loïs Rigouste , Emmanuel Giguet , Régis Clouard
20ème conférence du Traitement Automatique du Langage Naturel 2013 (TALN 2013), Jun 2013, Sables d'Olonne, France
Communication dans un congrès hal-01074950v1
Image document

DEFT2013, une cuisine de caractères

Gaël Lejeune , Charlotte Lecluze , Romain Brixtel
20ème conférence du Traitement Automatique du Langage Naturel 2013 (TALN 2013), Jun 2013, Sables d'Olonne, France
Communication dans un congrès hal-01074649v1
Image document

DAnIEL, parsimonious yet high-coverage multilingual epidemic surveillance

Gaël Lejeune , Romain Brixtel , Charlotte Lecluze , Antoine Doucet , Nadine Lucas
20ème conférence du Traitement Automatique du Langage Naturel 2013 (TALN 2013), Jun 2013, Sables d'Olonne, France. p.787-788
Communication dans un congrès hal-01074881v1
Image document

Détection de mots-clés par approches au grain caractère et au grain mot

Gaëlle Doualan , Mathieu Boucher , Romain Brixtel , Gaël Lejeune , Gaël Dias
TALN 2012, Jun 2012, Grenoble, France. pp.41-48
Communication dans un congrès hal-01073775v1

Pour une approche cibliste en TAL : le cas de l'analyse automatique de la presse

Gaël Lejeune , Christine Durieux
Colloque international : Rhétorique et Traduction, Jan 2012, Orléans, France
Communication dans un congrès hal-01071938v1
Image document

Deft 2011: appariements de résumés et d'articles scientifiques fondés sur des distributions de chaînes de caractères

Gaël Lejeune , Romain Brixtel , Emmanuel Giguet
TALN 2011, Jun 2011, Montpellier, France. pp.53-64
Communication dans un congrès hal-01070769v1
Image document

Filtering news for epidemic surveillance: towards processing more languages with fewer resources

Gaël Lejeune , Antoine Doucet , Roman Yangarber , Nadine Lucas
4th International worshop on cross-lingual information access CLIA 2010, Aug 2010, Pekin, China. 8 p
Communication dans un congrès hal-01067156v1
Image document

Tentative d'approche multilingue en extraction d'information

Gaël Lejeune , Nadine Lucas , Antoine Doucet
JADT Journées internationales d'Analyse statistique des Données Textuelles, Jun 2010, rome, Italie. pp.1259-1267
Communication dans un congrès hal-01067147v1
Image document

Structure patterns in Information Extraction: a multilingual solution?

Gaël Lejeune
Advances in Methods of Information and Communication Technology, May 2009, Petrozavodsk, Russia. pp.105-111
Communication dans un congrès hal-00605691v1

Réutiliser les corpus numériques constitués par OCR : bruit et silence dans les data papers

Caroline Koudoro-Parfait , Jean-Baptiste Tanguy , Gaël Lejeune
dhnord2021 - Publier, partager, réutiliser les données de la recherche : les data papers et leurs enjeux, Nov 2021, En ligne, France
Poster de conférence hal-04029006v1
Image document

Digital ou Numérique : un phénomène d'emprunt au cœur de la start-up nation ?

Lichao Zhu , Gaël Lejeune
Journées de Linguistique de Corpus (JLC) 2019, Nov 2019, Grenoble, France
Poster de conférence hal-02571641v1

Twitter and the Dissemination of Information Related to the Access to Credit for Cancer Survivors

Renaud Debailly , Hugo Jeanningros , Gaël Lejeune
Social Computing and Social Media: Design, User Experience and Impact, 13315, Springer International Publishing, pp.517-528, 2022, Lecture Notes in Computer Science, ⟨10.1007/978-3-031-05061-9_36⟩
Chapitre d'ouvrage hal-04224070v1
Image document

Multilingual Epidemic Event Extraction

Stephen Mutuvi , Emanuela Boros , Antoine Doucet , Gaël Lejeune , Adam Jatowt
Hao-Ren Ke; Chei Sian Lee; Kazunari Sugiyama. Towards Open and Trustworthy Digital Societies. 23rd International Conference on Asia-Pacific Digital Libraries, ICADL 2021, Virtual Event, December 1–3, 2021, Proceedings, 13133, Springer, pp.139-156, 2021, Lecture Notes in Computer Science, 978-3-030-91668-8. ⟨10.1007/978-3-030-91669-5_12⟩
Chapitre d'ouvrage hal-03480551v1

Automatic Stylistic Analysis: a search for efficient and interpretable descriptors to characterize individual writing style

Anaëlle Baledent , Gaël Lejeune
Phraséologie et stylistique de la langue littéraire Phraseology and Stylistics of Literary Language, Peter Lang, 2020, ⟨10.3726/b17628⟩
Chapitre d'ouvrage hal-03089956v1
Image document

DAnIEL: Language Independent Character-Based News Surveillance

Gaël Lejeune , Romain Brixtel , Antoine Doucet , Nadine Lucas
Isahara, Hitoshi and Kanzaki, Kyoko. Advances in Natural Language Processing: 8th International Conference on NLP, JapTAL 2012, Springer, pp.64-75, 2012, 978-3-642-33982-0. ⟨10.1007/978-3-642-33983-7_7⟩
Chapitre d'ouvrage hal-01071903v1

A proposal for a multilingual epidemic surveillance system

Gaël Lejeune , Mohamed Hatmi , Antoine Doucet , Silja Huttunen , Nadine Lucas
User Centric Media, Springer, pp 343-348, 2010, Lecture Notes of the Institute for Computer Sciences, Social Informatics and Telecommunications Engineering, ⟨10.1007/978-3-642-12630-7_43⟩
Chapitre d'ouvrage hal-01067792v1

Corpus du projet Antonomaz

Karine Abiven , Gaël Lejeune
2022, https://antonomaz.huma-num.fr
Autre publication scientifique hal-04036158v1