Gaël Lejeune
63
Documents
Présentation
Pour des informations complètes, mon site personnel : <http://lejeunegael.fr/>
Publications
|
SPQR@Deft2023: Similarité Sorbonne Pour les Systèmes de Question Réponse18e Conférence en Recherche d'Information et Applications -- 16e Rencontres Jeunes Chercheurs en RI -- 30e Conférence sur le Traitement Automatique des Langues Naturelles -- 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, 2023, Paris, France. pp.11-22
Communication dans un congrès
hal-04131579v1
|
|
SPQR@Deft2023: Résolution automatique de QCM médicaux à partir de corpus de domaine et de mesures de similaritéActes du Défi Fouille de Textes@TALN2023, ATALA, Jun 2023, Paris, France. https://coria-taln-2023.sciencesconf.org/data/proceedings_DEFT.pdf
Communication dans un congrès
hal-04131847v1
|
|
Stylo@DEFT2022 : Notation automatique de copies d’étudiant·e·s par combinaisons de méthodes de similaritéTraitement Automatique des Langues Naturelles, 2022, Avignon, France. pp.11-22
Communication dans un congrès
hal-03703281v1
|
|
Reconnaissance d'entités nommées sur des sorties OCR bruitées : des pistes pour la désambiguïsation morphologique automatiqueTraitement Automatique des Langues Naturelles, 2022, Avignon, France. pp.45-55
Communication dans un congrès
hal-03701476v1
|
|
Fine-tuning de modèles de langues pour la veille épidémiologique multilingue avec peu de ressourcesTraitement Automatique des Langues Naturelles (TALN 2022), Jun 2022, Avignon, France. pp.345-354
Communication dans un congrès
hal-03701516v1
|
X-COTE – Extraction de Contenus Textuels du WebTALN-RECITAL 2021, Jun 2021, Lille, France
Communication dans un congrès
hal-03382641v1
|
|
|
Étude comparative de méthodes de classification multilingue appliquées à l'épidémiologieCOnférence en Recherche d'Informations et Applications - CORIA 2021, French Information Retrieval Conference, Apr 2021, Grenoble (virtuel), France. ⟨10.5281/zenodo.4734472⟩
Communication dans un congrès
hal-03320343v1
|
|
Daniel@FinTOC-2021: Taking Advantage of Images and Vectorial Shapes in Native PDF Document Analysis3rd Financial Narrative Processing Workshop, Sep 2021, Lancaster, United Kingdom. pp.70-74
Communication dans un congrès
hal-03744586v1
|
|
Daniel@FinTOC’2 Shared Task: Title Detection and Structure Extraction1st Joint Workshop on Financial Narrative Processing and MultiLing Financial Summarisation @COLING’2020, Dec 2020, Barcelone, Spain
Communication dans un congrès
hal-03024867v1
|
|
Dating Ancient texts: an Approach for Noisy French DocumentsLanguage Resources and Evaluation Conference (LREC) 2020, May 2020, Marseille, France
Communication dans un congrès
hal-02571633v1
|
|
Voting Classifier vs Deep learning method in Arabic Dialect Identification: Proceedings of the Fifth Arabic Natural Language Processing Workshop, COLING 2020, Dec 2020, Barcelone, Spain
Communication dans un congrès
hal-03089957v1
|
Sociologie de l'Informatique et Informatique de la SociologieJournée d'Etudes Sociologie et Informatique (SIBON), Jan 2020, Paris, France
Communication dans un congrès
hal-02570351v1
|
|
|
A Dataset for Multi-lingual Epidemiological Event ExtractionProceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020), May 2020, Marseille, France. pp.4139-4144
Communication dans un congrès
hal-02732848v1
|
|
Bien choisir son outil d'extraction de contenu à partir du Web6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 4 : Démonstrations et résumés d'articles internationaux, Jun 2020, Nancy, France. pp.46-49
Communication dans un congrès
hal-02768510v3
|
|
Impact Analysis of Document Digitization on Event Extraction4th Workshop on Natural Language for Artificial Intelligence (NL4AI 2020) co-located with the 19th International Conference of the Italian Association for Artificial Intelligence (AI*IA 2020), Nov 2020, Virtual, Italy. pp.17-28
Communication dans un congrès
hal-03026148v1
|
|
Multilingual Epidemiological Text Classification: A Comparative StudyCOLING, International Conference on Computational Linguistics, Dec 2020, Barcelone, Spain. pp.6172-6183, ⟨10.18653/v1/2020.coling-main.543⟩
Communication dans un congrès
hal-03089807v1
|
|
Calcul de similarité entre phrases : quelles mesures et quels descripteurs ?6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Atelier DÉfi Fouille de Textes, 2020, Nancy, France. pp.14-25
Communication dans un congrès
hal-02784738v3
|
|
SinNer@Clef-Hipe2020 : Sinful adaptation of SotA models for Named Entity Recognition in French and GermanCLEF 2020 Working Notes. Working Notes of CLEF 2020 - Conference and Labs of the Evaluation Forum, Sep 2020, Thessaloniki / Virtual, Greece
Communication dans un congrès
hal-02984746v1
|
|
Que recèlent les données textuelles issues du web ?6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). 2e atelier Éthique et TRaitemeNt Automatique des Langues (ETeRNAL), 2020, Nancy, France. pp.19-28
Communication dans un congrès
hal-02750223v3
|
MICHAEL: Mining Character-level Patterns for Arabic Dialect Identification (MADAR Challenge)Proceedings of the Fourth Arabic Natural Language Processing Workshop, Aug 2019, Florence, France. pp.229-233, ⟨10.18653/v1/W19-4627⟩
Communication dans un congrès
hal-02467486v1
|
|
|
Indexation et appariements de documents cliniques pour le Deft 2019TALN -Défi Fouille de Textes (DEFT) 2019, Jul 2019, Toulouse, France
Communication dans un congrès
hal-02467526v1
|
|
Daniel@FinTOC-2019 Shared Task : TOC Extraction and Title DetectionThe Second Financial Narrative Processing Workshop (FNP 2019), Sep 2019, Turku, Finland. pp.63-68
Communication dans un congrès
hal-02303131v1
|
Analyse stylistique automatique : à la recherche d'indices efficaces et pertinents pour caractériser le style de DumasPhraséologie et stylistique de la langue littéraire, Mar 2019, Erlangen, Allemagne
Communication dans un congrès
hal-02939782v1
|
|
|
Analyse Diachronique de Corpus : le cas du pokerJournées d'Analyse statistique des Données Textuelles (JADT) 2018, Jun 2018, Rome, Italie
Communication dans un congrès
hal-02467662v1
|
|
Modèles en Caractères pour la Détection de Polarité dans les TweetsAtelier DEFT 2018, May 2018, Rennes, France
Communication dans un congrès
hal-01988907v1
|
Character Based Pattern Mining for Neology DetectionProceedings of the First Workshop on Subword and Character Level Models in NLP, Sep 2017, Copenhagen, France. pp.25-30, ⟨10.18653/v1/W17-4103⟩
Communication dans un congrès
hal-02467738v1
|
|
|
Tweetaneuse : Fouille de motifs en caractères et plongement lexical à l’assaut du deft 201724e Conférence sur le Traitement Automatique des Langues Naturelles (TALN) : Analyse d'opinion et langage figuratif dans des tweets, Jun 2017, Orléans, France. pp. 65-76
Communication dans un congrès
hal-02362125v1
|
|
Highlighting Psychological Features for Predicting Child Interjections During Story TellingINTERSPEECH 2016, Aug 2016, San Francisco, United States. ⟨10.21437/Interspeech.2016-527⟩
Communication dans un congrès
hal-01639793v1
|
|
Ambiguity Diagnosis for Terms in Digital HumanitiesLanguage Resources and Evaluation Conference, May 2016, Portorož, Slovenia
Communication dans un congrès
hal-01423650v1
|
Intrinsic and Extrinsic Evalution of Web Page CleaningInternational Symposium on Web Algorithms, Jun 2016, Deauville, France
Communication dans un congrès
hal-01639799v1
|
|
|
Évaluation intrinsèque et extrinsèque du nettoyage de pages WebTraitement Automatique des Langues Naturelles 2015, Jun 2015, Caen, France
Communication dans un congrès
hal-01170005v1
|
|
A stylometric approach for opinion miningTraitement Automatique des Langues Naturelles 2015, DEFT, Jun 2015, caen, France
Communication dans un congrès
hal-01170000v1
|
|
Towards diagnosing ambiguity of candidate termsTraitement Automatique des Langues Naturelles 2015, Jun 2015, Caen, France
Communication dans un congrès
hal-01169996v1
|
|
Apports de l'analyse automatique multilingue pour la veille épidémiologiqueJournées internationales d’Analyse statistique des Données Textuelles, Jun 2014, Paris, France
Communication dans un congrès
hal-01075057v1
|
Any Language Early Detection of Epidemic Diseases from Web News StreamsHealthcare Informatics (ICHI), 2013 IEEE International Conference on, Sep 2013, philadelphie, United States. pp.159 - 168, ⟨10.1109/ICHI.2013.94⟩
Communication dans un congrès
hal-01073195v1
|
|
|
DAnIEL, parsimonious yet high-coverage multilingual epidemic surveillance20ème conférence du Traitement Automatique du Langage Naturel 2013 (TALN 2013), Jun 2013, Sables d'Olonne, France. p.787-788
Communication dans un congrès
hal-01074881v1
|
|
DEFT2013, une cuisine de caractères20ème conférence du Traitement Automatique du Langage Naturel 2013 (TALN 2013), Jun 2013, Sables d'Olonne, France
Communication dans un congrès
hal-01074649v1
|
|
Détection de zones parallèles à l’intérieur de multi-documents pour l’alignement multilingue20ème conférence du Traitement Automatique du Langage Naturel 2013 (TALN 2013), Jun 2013, Sables d'Olonne, France
Communication dans un congrès
hal-01074950v1
|
|
Added-Value of Automatic Multilingual Text Analysis for Epidemic Surveillance14th Conference on Artificial Intelligence in Medicine, May 2013, Murcia, Spain. pp.284 - 294, ⟨10.1007/978-3-642-38326-7_40⟩
Communication dans un congrès
hal-01074535v1
|
|
Détection de mots-clés par approches au grain caractère et au grain motTALN 2012, Jun 2012, Grenoble, France. pp.41-48
Communication dans un congrès
hal-01073775v1
|
Pour une approche cibliste en TAL : le cas de l'analyse automatique de la presseColloque international : Rhétorique et Traduction, Jan 2012, Orléans, France
Communication dans un congrès
hal-01071938v1
|
|
|
Deft 2011: appariements de résumés et d'articles scientifiques fondés sur des distributions de chaînes de caractèresTALN 2011, Jun 2011, Montpellier, France. pp.53-64
Communication dans un congrès
hal-01070769v1
|
|
Tentative d'approche multilingue en extraction d'informationJADT Journées internationales d'Analyse statistique des Données Textuelles, Jun 2010, rome, Italie. pp.1259-1267
Communication dans un congrès
hal-01067147v1
|
|
Filtering news for epidemic surveillance: towards processing more languages with fewer resources4th International worshop on cross-lingual information access CLIA 2010, Aug 2010, Pekin, China. 8 p
Communication dans un congrès
hal-01067156v1
|
|
Structure patterns in Information Extraction: a multilingual solution?Advances in Methods of Information and Communication Technology, May 2009, Petrozavodsk, Russia. pp.105-111
Communication dans un congrès
hal-00605691v1
|
Réutiliser les corpus numériques constitués par OCR : bruit et silence dans les data papersdhnord2021 - Publier, partager, réutiliser les données de la recherche : les data papers et leurs enjeux, Nov 2021, En ligne, France
Poster de conférence
hal-04029006v1
|
|
|
Digital ou Numérique : un phénomène d'emprunt au cœur de la start-up nation ?Journées de Linguistique de Corpus (JLC) 2019, Nov 2019, Grenoble, France
Poster de conférence
hal-02571641v1
|
Twitter and the Dissemination of Information Related to the Access to Credit for Cancer SurvivorsSocial Computing and Social Media: Design, User Experience and Impact, 13315, Springer International Publishing, pp.517-528, 2022, Lecture Notes in Computer Science, ⟨10.1007/978-3-031-05061-9_36⟩
Chapitre d'ouvrage
hal-04224070v1
|
|
|
Multilingual Epidemic Event ExtractionHao-Ren Ke; Chei Sian Lee; Kazunari Sugiyama. Towards Open and Trustworthy Digital Societies. 23rd International Conference on Asia-Pacific Digital Libraries, ICADL 2021, Virtual Event, December 1–3, 2021, Proceedings, 13133, Springer, pp.139-156, 2021, Lecture Notes in Computer Science, 978-3-030-91668-8. ⟨10.1007/978-3-030-91669-5_12⟩
Chapitre d'ouvrage
hal-03480551v1
|
Automatic Stylistic Analysis: a search for efficient and interpretable descriptors to characterize individual writing stylePhraséologie et stylistique de la langue littéraire Phraseology and Stylistics of Literary Language, Peter Lang, 2020, ⟨10.3726/b17628⟩
Chapitre d'ouvrage
hal-03089956v1
|
|
|
DAnIEL: Language Independent Character-Based News SurveillanceIsahara, Hitoshi and Kanzaki, Kyoko. Advances in Natural Language Processing: 8th International Conference on NLP, JapTAL 2012, Springer, pp.64-75, 2012, 978-3-642-33982-0. ⟨10.1007/978-3-642-33983-7_7⟩
Chapitre d'ouvrage
hal-01071903v1
|
A proposal for a multilingual epidemic surveillance systemUser Centric Media, Springer, pp 343-348, 2010, Lecture Notes of the Institute for Computer Sciences, Social Informatics and Telecommunications Engineering, ⟨10.1007/978-3-642-12630-7_43⟩
Chapitre d'ouvrage
hal-01067792v1
|
Corpus du projet Antonomaz2022, https://antonomaz.huma-num.fr
Autre publication scientifique
hal-04036158v1
|
|
Plans de Gestion de Données des projets membres du consortium CAHIER[Rapport de recherche] CAHIER - Consortium CAHIER. 2021, 100 p
Rapport
hal-03465075v1
|
|
Veille épidémiologique multilingue : une approche parcimonieuse au grain caractère fondée sur le genre textuelTraitement du texte et du document. Université de Caen, 2013. Français. ⟨NNT : ⟩
Thèse
tel-01074940v1
|
|
De la variation linguistique et de son influence sur l'application de méthodes de Traitement Automatique des LanguesTraitement du texte et du document. Sorbonne Universite, 2023
HDR
tel-04360967v4
|