Accéder directement au contenu

Benoît Sagot

247
Documents

Publications

Image document

Ancien ou moderne ? Pistes computationnelles pour l'analyse graphématique des textes écrits au XVIIe siècle

Simon Gabay , Philippe Gambette , Rachel Bawden , Benoît Sagot
Linx, 2023, 85, ⟨10.4000/linx.9346⟩
Article dans une revue hal-04110764v1
Image document

Generative Spoken Dialogue Language Modeling

Tu Anh Nguyen , Eugene Kharitonov , Jade Copet , Yossi Adi , Wei-Ning Hsu
Transactions of the Association for Computational Linguistics, 2023, 11, pp.250-266. ⟨10.1162/tacl_a_00545⟩
Article dans une revue hal-03985368v2
Image document

DP-Parse: Finding Word Boundaries from Raw Speech with an Instance Lexicon

Robin Algayres , Tristan Ricoul , Julien Karadayi , Hugo Laurençon , Salah Zaiem
Transactions of the Association for Computational Linguistics, 2022, 10, pp.1051-1065. ⟨10.1162/tacl_a_00505⟩
Article dans une revue hal-03831873v1
Image document

Are discrete units necessary for Spoken Language Modeling?

Tu Anh Nguyen , Benoît Sagot , Emmanuel Dupoux
IEEE Journal of Selected Topics in Signal Processing, 2022
Article dans une revue hal-03831707v1
Image document

Quality at a Glance: An Audit of Web-Crawled Multilingual Datasets

Julia Kreutzer , Isaac Caswell , Lisa Wang , Ahsan Wahab , Daan van Esch
Transactions of the Association for Computational Linguistics, 2022, 10, pp.50-72. ⟨10.1162/tacl_a_00447⟩
Article dans une revue hal-03177623v1

Metathesis of Proto-Indo-European Sonorants

Romain Garnier , Benoît Sagot
Münchener Studien zur Sprachwissenschaft, 2019, 73 (1), pp.29-53
Article dans une revue hal-02681179v1
Image document

Inferring inflection classes with description length

Sacha Beniamine , Olivier Bonami , Benoît Sagot
Journal of Language Modelling, 2018, 5 (3), pp.465-525
Article dans une revue hal-01718879v1

Représentation de l’information sémantique lexicale : le modèle wordnet et son application au français

Benoît Sagot
Revue Française de Linguistique Appliquée, 2017, XXII
Article dans une revue hal-01583995v1
Image document

Computational methods for descriptive and theoretical morphology: a brief introduction

Olivier Bonami , Benoît Sagot
Morphology, 2017, Computational methods for descriptive and theoretical morphology, 27 (4), pp.1-7. ⟨10.1017/CBO9781139248860⟩
Article dans une revue hal-01628253v1
Image document

A shared substrate between Greek and Italic

Romain Garnier , Benoît Sagot
Indogermanische Forschungen, 2017, 122 (1), pp.29-60. ⟨10.1515/if-2017-0002⟩
Article dans une revue hal-01621467v1
Image document

Constructing a poor man’s wordnet in a resource-rich world

Darja Fišer , Benoît Sagot
Language Resources and Evaluation, 2015, 49 (3), pp.601-635. ⟨10.1007/s10579-015-9295-6⟩
Article dans une revue hal-01174492v1
Image document

The CoMeRe corpus for French: structuring and annotating heterogeneous CMC genres

Thierry Chanier , Céline Poudat , Benoît Sagot , Georges Antoniadis , Ciara R. Wigham
Journal for language technology and computational linguistics, 2014, 29 (2), pp.1-30
Article dans une revue halshs-00953507v2
Image document

Data-driven Synset Induction and Disambiguation for Wordnet Development

Marianna Apidianaki , Benoît Sagot
Language Resources and Evaluation, 2014, 48 (4), pp.655-677. ⟨10.1007/s10579-014-9291-2⟩
Article dans une revue hal-01088000v1
Image document

Coupling an annotated corpus and a lexicon for state-of-the-art POS tagging

Pascal Denis , Benoît Sagot
Language Resources and Evaluation, 2012, 46 (4), pp.721-736. ⟨10.1007/s10579-012-9193-0⟩
Article dans une revue inria-00614819v1
Image document

Introduction

Núria Bel , Benoît Sagot
Revue TAL : traitement automatique des langues, 2011, Ressources linguistiques libres / Free Language Resources, 52 (3)
Article dans une revue hal-01777624v1

Modélisation et implémentation de phénomènes non-canoniques

Géraldine Walther , Benoît Sagot
Revue TAL : traitement automatique des langues, 2011, 52 (2/2011), pp.91-122
Article dans une revue halshs-01441251v1

Ressources lexicales libres pour le français

Benoît Sagot
Culture et recherche, 2011, Diversité des langues et plurilinguisme, 124, pp.53
Article dans une revue inria-00617066v1

Modélisation et implémentation de phénomènes flexionnels non-canoniques

Géraldine Walther , Benoît Sagot
Revue TAL : traitement automatique des langues, 2011, Vers la morphologie et au-delà, 52 (2)
Article dans une revue inria-00614703v1
Image document

Exploitation des tables du Lexique-Grammaire pour l'analyse syntaxique automatique

Benoît Sagot , Elsa Tolone
Arena Romanistica - Journal of Romance studies, 2009, 4, pp.302-312
Article dans une revue hal-00461897v1
Image document

Extension et couplage de ressources syntaxiques et sémantiques sur les adverbes

Benoît Sagot , Karën Fort , Fabienne Venant
Lingvisticae investigationes : International Journal of Linguistics and Language, 2009, 32 (2), pp.305-315. ⟨10.1075/li.32.2.12sag⟩
Article dans une revue hal-00446914v1
Image document

Constructions pronominales dans Dicovalence et le lexique-grammaire – Intégration dans le Lefff

Laurence Danlos , Benoît Sagot
Lingvisticae investigationes : International Journal of Linguistics and Language, 2009, 32 (2), pp.293-304. ⟨10.1075/li.32.2.11dan⟩
Article dans une revue inria-00515459v1
Image document

Fouille d'erreurs sur des sorties d'analyseurs syntaxiques

Benoît Sagot , Éric Villemonte de La Clergerie
Revue TAL : traitement automatique des langues, 2008, 49 (1), pp.41-60
Article dans une revue inria-00515492v1
Image document

Améliorer un lexique syntaxique à l'aide des tables du lexique-grammaire — Constructions impersonnelles et expressions verbales figées

Benoît Sagot , Laurence Danlos
Cahiers du Cental, 2008, Description linguistique pour le traitement automatique du français, 5, pp.107-126
Article dans une revue inria-00515460v1
Image document

SxPipe 2: architecture pour le traitement pré-syntaxique de corpus bruts

Benoît Sagot , Pierre Boullier
Revue TAL : traitement automatique des langues, 2008, 49 (2), pp.155-188
Article dans une revue inria-00515489v1
Image document

Analyse syntaxique profonde à grande échelle: SxLFG

Pierre Boullier , Benoît Sagot
Revue TAL : traitement automatique des langues, 2005, 46 (2), pp.65-89
Article dans une revue inria-00521227v1
Image document

From Raw Corpus to Word Lattices: Robust Pre-parsing Processing with SxPipe

Benoît Sagot , Pierre Boullier
Archives of Control Sciences, 2005, Language and Technology. Human Language Technologies as a Challenge for Computer Science and Linguistics, 15 (4), pp.653-662
Article dans une revue inria-00521228v1
Image document

From Text to Source: Results in Detecting Large Language Model-Generated Content

Wissam Antoun , Djamé Seddah , Benoît Sagot
The 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), May 2024, Torino, Italy
Communication dans un congrès hal-04264050v1
Image document

When your Cousin has the Right Connections: Unsupervised Bilingual Lexicon Induction for Related Data-Imbalanced Languages

Niyati Bafna , Cristina España-Bonet , Josef van Genabith , Benoît Sagot , Rachel Bawden
LREC-Coling 2024 - Joint International Conference on Computational Linguistics, Language Resources and Evaluation, May 2024, Torino, Italy
Communication dans un congrès hal-04523029v1
Image document

Layout Analysis Dataset with SegmOnto

Thibault Clérice , Juliette Janes , Hugo Scheithauer , Sarah Bénière , Laurent Romary
DH2024 - Annual conference of the Alliance of Digital Humanities Organizations, ADHO, Aug 2024, Washington DC, United States
Communication dans un congrès hal-04513725v1
Image document

Generative Spoken Language Model based on continuous word-sized audio tokens

Robin Algayres , Yossi Adi , Tu Anh Nguyen , Jade Copet , Gabriel Synnaeve
The 2023 Conference on Empirical Methods in Natural Language Processing, Dec 2023, Singapore, Singapore
Communication dans un congrès hal-04402373v1
Image document

Modular Speech-to-Text Translation for Zero-Shot Cross-Modal Transfer

Paul-Ambroise Duquenne , Holger Schwenk , Benoît Sagot
INTERSPEECH 2023, Aug 2023, Dublin, Ireland. ⟨10.21437/Interspeech.2023-2484⟩
Communication dans un congrès hal-04264023v1
Image document

Exploring Data-Centric Strategies for French Patent Classification: A Baseline and Comparisons

You Zuo , Kim Gerdes , Houda Mouzoun , Samir Ghamri Doudane , Benoît Sagot
18e Conférence en Recherche d'Information et Applications -- 16e Rencontres Jeunes Chercheurs en RI -- 30e Conférence sur le Traitement Automatique des Langues Naturelles -- 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, Jun 2023, Paris, France. pp.349-365
Communication dans un congrès hal-04130188v1
Image document

RoCS-MT: Robustness Challenge Set for Machine Translation

Rachel Bawden , Benoît Sagot
WMT23 - Eighth Conference on Machine Translation, Dec 2023, Singapore, Singapore. pp.198--216
Communication dans un congrès hal-04300824v1
Image document

Tackling Ambiguity with Images: Improved Multimodal Machine Translation and Contrastive Evaluation

Matthieu Futeral , Cordelia Schmid , Ivan Laptev , Benoît Sagot , Rachel Bawden
Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), Jul 2023, Toronto, Canada. pp.5394-5413, ⟨10.18653/v1/2023.acl-long.295⟩
Communication dans un congrès hal-03977982v1
Image document

XLS-R fine-tuning on noisy word boundaries for unsupervised speech segmentation into words

Robin Algayres , Pablo Diego-Simon , Benoît Sagot , Emmanuel Dupoux
EMNLP 2023 - Conference on Empirical Methods in Natural Language Processing, Association for Computational Linguistics, Dec 2023, Singapore, Singapore
Communication dans un congrès hal-04398496v1
Image document

Neural Agents Struggle to Take Turns in Bidirectional Emergent Communication

Valentin Taillandier , Dieuwke Hupkes , Benoît Sagot , Emmanuel Dupoux , Paul Michel
ICLR 2023 - 11th International Conference on Learning Representation, May 2023, Kigali, Rwanda
Communication dans un congrès hal-04264045v1
Image document

Cross-lingual Strategies for Low-resource Language Modeling: A Study on Five Indic Dialects

Niyati Bafna , Cristina España-Bonet , Josef van Genabith , Benoît Sagot , Rachel Bawden
18e Conférence en Recherche d'Information et Applications -- 16e Rencontres Jeunes Chercheurs en RI -- 30e Conférence sur le Traitement Automatique des Langues Naturelles -- 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, Jun 2023, Paris, France. pp.28-42
Communication dans un congrès hal-04130175v1
Image document

SpeechMatrix: A Large-Scale Mined Corpus of Multilingual Speech-to-Speech Translations

Paul-Ambroise Duquenne , Hongyu Gong , Ning Dong , Jingfei Du , Ann Lee
ACL 2023 - 61st Annual Meeting of the Association for Computational Linguistics, Aug 2023, Toronto, Canada. ⟨10.18653/v1/2023.acl-long.899⟩
Communication dans un congrès hal-04264040v1
Image document

Towards a Robust Detection of Language Model-Generated Text: Is ChatGPT that easy to detect?

Wissam Antoun , Virginie Mouilleron , Benoît Sagot , Djamé Seddah
18e Conférence en Recherche d'Information et Applications -- 16e Rencontres Jeunes Chercheurs en RI -- 30e Conférence sur le Traitement Automatique des Langues Naturelles -- 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, Jun 2023, Paris, France. pp.14-27
Communication dans un congrès hal-04130146v1
Image document

Probing Multilingual Cognate Prediction Models

Clémentine Fourrier , Benoît Sagot
ACL 2022 - Findings of the Association for Computational Linguistics, May 2022, Dublin, Ireland
Communication dans un congrès hal-03614691v1
Image document

Automatic Normalisation of Early Modern French

Rachel Bawden , Jonathan Poinhos , Eleni Kogkitsidou , Philippe Gambette , Benoît Sagot
LREC 2022 - 13th Language Resources and Evaluation Conference, European Language Resources Association, Jun 2022, Marseille, France. pp.3354-3366, ⟨10.5281/zenodo.5865428⟩
Communication dans un congrès hal-03540226v2

Vers l’étude linguistique sur données artificielles

Simon Gabay , Rachel Bawden , Benoît Sagot , Philippe Gambette
Variation(s) en français, ATILF, Nov 2022, Nancy, France
Communication dans un congrès hal-03856660v1
Image document

Le changement linguistique au XVIIe s. : nouvelles approches scriptométriques

Simon Gabay , Rachel Bawden , Philippe Gambette , Jonathan Poinhos , Eleni Kogkitsidou
CMLF 2022 - 8e Congrès Mondial de Linguistique Française, Jul 2022, Orléans, France. pp.02006.1-14, ⟨10.1051/shsconf/202213802006⟩
Communication dans un congrès hal-03681556v1
Image document

Patent Classification using Extreme Multi-label Learning: A Case Study of French Patents

You Zuo , Houda Mouzoun , Samir Ghamri Doudane , Kim Gerdes , Benoît Sagot
SIGIR 2022 - PatentSemTech workshop - 3rd Workshop on Patent Text Mining and Semantic Technologies, Jul 2022, Madrid, Spain
Communication dans un congrès hal-03850405v1
Image document

BERTrade: Using Contextual Embeddings to Parse Old French

Loïc Grobol , Mathilde Regnault , Pedro Ortiz Suarez , Benoît Sagot , Laurent Romary
13th Language Resources and Evaluation Conference, European Language Resources Association, Jun 2022, Marseille, France
Communication dans un congrès hal-03736840v1
Image document

MUSS: Multilingual Unsupervised Sentence Simplification by Mining Paraphrases

Louis Martin , Angela Fan , Eric Villemonte de La Clergerie , Antoine Bordes , Benoît Sagot
LREC 2022 - 13th Language Resources and Evaluation Conference, Jun 2022, Marseille, France
Communication dans un congrès hal-03834719v1
Image document

T-Modules: Translation Modules for Zero-Shot Cross-Modal Machine Translation

Paul-Ambroise Duquenne , Hongyu Gong , Benoît Sagot , Holger Schwenk
EMNLP 2022 - 2022 Conference on Empirical Methods in Natural Language Processing, Dec 2022, Abu Dhabi, United Arab Emirates
Communication dans un congrès hal-03834732v1
Image document

Towards a Cleaner Document-Oriented Multilingual Crawled Corpus

Julien Abadji , Pedro Ortiz Suarez , Laurent Romary , Benoît Sagot
Thirteenth Language Resources and Evaluation Conference - LREC 2022, Jun 2022, Marseille, France
Communication dans un congrès hal-03536361v1
Image document

From FreEM to D'AlemBERT

Simon Gabay , Pedro Ortiz Suarez , Alexandre Bartz , Alix Chagué , Rachel Bawden
13th Language Resources and Evaluation Conference - LREC 2022, European Language Resources Association, Jun 2022, Marseille, France. pp.3367-3374
Communication dans un congrès hal-03596653v1
Image document

Le projet FREEM : ressources, outils et enjeux pour l’étude du français d’Ancien Régime

Simon Gabay , Pedro Ortiz Suarez , Rachel Bawden , Alexandre Bartz , Philippe Gambette
TALN 2022 - Traitement Automatique des Langues Naturelles, Jun 2022, Avignon, France. pp.154-165
Communication dans un congrès hal-03701524v1
Image document

Complex Labelling and Similarity Prediction in Legal Texts: Automatic Analysis of France's Court of Cassation Rulings

Thibault Charmet , Inès Cherichi , Matthieu Allain , Urszula Czerwinska , Amaury Fouret
LREC 2022 - 13th Language Resources and Evaluation Conference, Jun 2022, Marseille, France
Communication dans un congrès hal-03663110v1

Can Character-based Language Models Improve Downstream Task Performance in Low-Resource and Noisy Language Scenarios?

Arij Riabi , Benoît Sagot , Djamé Seddah
Seventh Workshop on Noisy User-generated Text (W-NUT 2021, colocated with EMNLP 2021), Jan 2022, Punta Cana, Dominican Republic
Communication dans un congrès hal-03527328v1
Image document

The MRL 2022 Shared Task on Multilingual Clause-level Morphology

Omer Goldman , Francesco Tinner , Hila Gonen , Benjamin Muller , Victoria Basmov
1st Shared Task on Multilingual Clause-level Morphology, Dec 2022, Abu Dhabi, United Arab Emirates
Communication dans un congrès hal-03878174v1
Image document

Gallic(orpor)a : Extraction, annotation et diffusion de l’information textuelle et visuelle en diachronie longue

Benoît Sagot , Laurent Romary , Rachel Bawden , Pedro Javier Ortiz Suárez , Kelly Christensen
DataLab de la BnF : Restitution des travaux 2022, DataLab de la BnF, Dec 2022, Paris, France
Communication dans un congrès hal-03930542v1

Quand être absent de mBERT n'est que le commencement : Gérer de nouvelles langues à l’aide de modèles de langues multilingues

Benjamin Muller , Antonios Anastasopoulos , Benoît Sagot , Djamé Seddah
TALN 2022 - 29° conférence sur le Traitement Automatique des Langues Naturelles, Jun 2022, Avignon, France. pp.450-451
Communication dans un congrès hal-03701503v1
Image document

Inria-ALMAnaCH at the WMT 2022 shared task: Does Transcription Help Cross-Script Machine Translation?

Jesujoba O Alabi , Lydia Nishimwe , Benjamin Muller , Camille Rey , Benoît Sagot
EMNLP 2022 - Seventh Conference on Machine Translation (WMT22 - Workshop on Statistical Machine Translation), Dec 2022, Abu Dhabi, United Arab Emirates
Communication dans un congrès hal-03836180v1
Image document

MANTa: Efficient Gradient-Based Tokenization for Robust End-to-End Language Modeling

Nathan Godey , Roman Castagné , Eric Villemonte de La Clergerie , Benoît Sagot
EMNLP 2022 - The 2022 Conference on Empirical Methods in Natural Language Processing, Dec 2022, Abu Dhabi, United Arab Emirates
Communication dans un congrès hal-03844262v1
Image document

Speech Sequence Embeddings using Nearest Neighbors Contrastive Learning

Robin Algayres , Adel Nabli , Benoît Sagot , Emmanuel Dupoux
Interspeech 2022 - 23rd INTERSPEECH Conference, Sep 2022, Incheon, South Korea
Communication dans un congrès hal-03831888v1
Image document

Expanding the content model of annotationBlock

Alexandre Bartz , Juliette Janes , Laurent Romary , Philippe Gambette , Rachel Bawden
Next Gen TEI, 2021 - TEI Conference and Members’ Meeting, Oct 2021, Virtual, United States
Communication dans un congrès hal-03380805v1
Image document

Variation graphique dans les documents d'Ancien Régime : Nouvelles approches scriptométriques

Simon Gabay , Philippe Gambette , Rachel Bawden , Jonathan Poinhos , Eleni Kogkitsidou
Journée d’étude : « Pour une histoire de la langue ‘par en bas’: textes privés et variation des langues dans le passé », Sep 2021, Paris, France
Communication dans un congrès hal-03357080v1
Image document

First Align, then Predict: Understanding the Cross-Lingual Ability of Multilingual BERT

Benjamin Muller , Yanai Elazar , Benoît Sagot , Djamé Seddah
EACL 2021 - The 16th Conference of the European Chapter of the Association for Computational Linguistics, Apr 2021, Kyiv / Virtual, Ukraine
Communication dans un congrès hal-03239087v1
Image document

When Being Unseen from mBERT is just the Beginning: Handling New Languages With Multilingual Language Models

Benjamin Muller , Antonios Anastasopoulos , Benoît Sagot , Djamé Seddah
NAACL-HLT 2021 - 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Jun 2021, Mexico City, Mexico
Communication dans un congrès hal-03251105v1
Image document

Can Cognate Prediction Be Modelled as a Low-Resource Machine Translation Task?

Clémentine Fourrier , Rachel Bawden , Benoît Sagot
ACL-IJCNLP 2021 - Findings of the Association for Computational Linguistics, Aug 2021, Bangkok, Thailand
Communication dans un congrès hal-03243380v2
Image document

Synthetic Data Augmentation for Zero-Shot Cross-Lingual Question Answering

Arij Riabi , Thomas Scialom , Rachel Keraron , Benoît Sagot , Djamé Seddah
Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, Nov 2021, Punta cana, Dominican Republic. ⟨10.18653/v1/2021.emnlp-main.562⟩
Communication dans un congrès hal-03109187v1
Image document

Ungoliant: An Optimized Pipeline for the Generation of a Very Large-Scale Multilingual Web Corpus

Julien Abadji , Pedro Javier Ortiz Suárez , Laurent Romary , Benoît Sagot
CMLC 2021 - 9th Workshop on Challenges in the Management of Large Corpora, Jul 2021, Limerick / Virtual, Ireland. ⟨10.14618/ids-pub-10468⟩
Communication dans un congrès hal-03301590v1
Image document

Le Traitement Automatique des Langues au service du vin

Antoine Gérard , Benoît Sagot , Emilie Pons
Dataquitaine 2021 - IA, Recherche Opérationnelle & Data Science, Feb 2021, Bordeaux / Virtual, France
Communication dans un congrès hal-03146219v1
Image document

Comparing Statistical and Neural Models for Learning Sound Correspondences

Clémentine Fourrier , Benoît Sagot
LT4HALA 2020 - First Workshop on Language Technologies for Historical and Ancient Languages, May 2020, Marseille, France
Communication dans un congrès hal-02529929v1
Image document

Controllable Sentence Simplification

Louis Martin , Éric Villemonte de La Clergerie , Benoît Sagot , Antoine Bordes
LREC 2020 - 12th Language Resources and Evaluation Conference, May 2020, Marseille, France
Communication dans un congrès hal-02678214v1
Image document

A Monolingual Approach to Contextualized Word Embeddings for Mid-Resource Languages

Pedro Javier Ortiz Suárez , Laurent Romary , Benoît Sagot
ACL 2020 - 58th Annual Meeting of the Association for Computational Linguistics, Jul 2020, Seattle / Virtual, United States. ⟨10.18653/v1/2020.acl-main.156⟩
Communication dans un congrès hal-02863875v2
Image document

Building a User-Generated Content North-African Arabizi Treebank: Tackling Hell

Djamé Seddah , Farah Essaidi , Amal Fethi , Matthieu Futeral , Benjamin Muller
ACL 2020 - 58th Annual Meeting of the Association for Computational Linguistics, Jul 2020, Seattle / Virtual, United States. ⟨10.18653/v1/2020.acl-main.107⟩
Communication dans un congrès hal-02889804v1
Image document

Les modèles de langue contextuels Camembert pour le français : impact de la taille et de l'hétérogénéité des données d'entrainement

Louis Martin , Benjamin Muller , Pedro Javier Ortiz Suárez , Yoan Dupont , Laurent Romary
JEP-TALN-RECITAL 2020 - 33ème Journées d’Études sur la Parole, 27ème Conférence sur le Traitement Automatique des Langues Naturelles, 22ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, Jun 2020, Nancy / Virtuel, France. pp.54-65
Communication dans un congrès hal-02784755v3
Image document

OFrLex: A Computational Morphological and Syntactic Lexicon for Old French

Gaël Guibon , Benoît Sagot
LREC 2020 - 12th Language Resources and Evaluation Conference, May 2020, Marseille, France. 3217-3225 (updated version)
Communication dans un congrès hal-02677957v2
Image document

CamemBERT: a Tasty French Language Model

Louis Martin , Benjamin Muller , Pedro Javier Ortiz Suárez , Yoann Dupont , Laurent Romary
ACL 2020 - 58th Annual Meeting of the Association for Computational Linguistics, Jul 2020, Seattle / Virtual, United States. ⟨10.18653/v1/2020.acl-main.645⟩
Communication dans un congrès hal-02889805v1
Image document

Evaluating the reliability of acoustic speech embeddings

Robin Algayres , Mohamed Salah Zaiem , Benoît Sagot , Emmanuel Dupoux
INTERSPEECH 2020 - Annual Conference of the International Speech Communication Association, Oct 2020, Shanghai / Vitrtual, China
Communication dans un congrès hal-02977539v1
Image document

Methodological Aspects of Developing and Managing an Etymological Lexical Resource: Introducing EtymDB 2.0

Clémentine Fourrier , Benoît Sagot
LREC 2020 - 12th Language Resources and Evaluation Conference, May 2020, Marseille, France
Communication dans un congrès hal-02678100v1
Image document

Establishing a New State-of-the-Art for French Named Entity Recognition

Pedro Javier Ortiz Suárez , Yoann Dupont , Benjamin Muller , Laurent Romary , Benoît Sagot
LREC 2020 - 12th Language Resources and Evaluation Conference, May 2020, Marseille, France
Communication dans un congrès hal-02617950v2
Image document

ASSET: A Dataset for Tuning and Evaluation of Sentence Simplification Models with Multiple Rewriting Transformations

Fernando Alva-Manchego , Louis Martin , Antoine Bordes , Carolina Scarton , Benoît Sagot
ACL 2020 - 58th Annual Meeting of the Association for Computational Linguistics, Jul 2020, Seattle / Virtual, United States
Communication dans un congrès hal-02889823v1
Image document

French Contextualized Word-Embeddings with a sip of CaBeRnet: a New French Balanced Reference Corpus

Murielle Fabre , Pedro Javier Ortiz Suárez , Benoît Sagot , Éric Villemonte de La Clergerie
CMLC-8 - 8th Workshop on the Challenges in the Management of Large Corpora, May 2020, Marseille, France
Communication dans un congrès hal-02678358v1

Morphological complexities

Géraldine Walther , Benoît Sagot
16th SIGMORPHON Workshop on Computational Research in Phonetics, Phonology, and Morphology, Aug 2019, Florence, Italy
Communication dans un congrès hal-02266999v1
Image document

Preparing the Dictionnaire Universel for Automatic Enrichment

Pedro Javier Ortiz Suárez , Laurent Romary , Benoît Sagot
10th International Conference on Historical Lexicography and Lexicology (ICHLL), Jun 2019, Leeuwarden, Netherlands
Communication dans un congrès hal-02131598v1
Image document

Enhancing BERT for Lexical Normalization

Benjamin Muller , Benoît Sagot , Djamé Seddah
The 5th Workshop on Noisy User-generated Text (W-NUT), Nov 2019, Hong Kong, China
Communication dans un congrès hal-02294316v1
Image document

Développement d'un lexique morphologique et syntaxique de l'ancien français

Benoît Sagot
26ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), Jul 2019, Toulouse, France
Communication dans un congrès hal-02148701v2
Image document

Asynchronous Pipeline for Processing Huge Corpora on Medium to Low Resource Infrastructures

Pedro Javier Ortiz Suárez , Benoît Sagot , Laurent Romary
7th Workshop on the Challenges in the Management of Large Corpora (CMLC-7), Jul 2019, Cardiff, United Kingdom. ⟨10.14618/IDS-PUB-9021⟩
Communication dans un congrès hal-02148693v1
Image document

What does BERT learn about the structure of language?

Ganesh Jawahar , Benoît Sagot , Djamé Seddah
ACL 2019 - 57th Annual Meeting of the Association for Computational Linguistics, Jul 2019, Florence, Italy
Communication dans un congrès hal-02131630v1
Image document

New results on a centum substratum in Greek: the Lydian connection

Romain Garnier , Benoît Sagot
International Colloquium on Loanwords and Substrata in Indo-European languages, Jun 2018, Limoges, France
Communication dans un congrès hal-01798979v1
Image document

ELMoLex: Connecting ELMo and Lexicon features for Dependency Parsing

Ganesh Jawahar , Benjamin Muller , Amal Fethi , Louis Martin , Éric Villemonte de La Clergerie
CoNLL 2018 Shared Task: Multilingual Parsing from Raw Text to Universal Dependencies, Oct 2018, Brussels, Belgium. ⟨10.18653/v1/K18-2023⟩
Communication dans un congrès hal-01959045v1
Image document

A new PIE root *h1er ‘(to be) dark red, dusk red’: drawing the line between inherited and borrowed words for ‘red(ish)’, ‘pea’, ‘ore’, ‘dusk’ and ‘love’ in daughter languages

Benoît Sagot
International Colloquium on Loanwords and Substrata in Indo-European languages, Jun 2018, Limoges, France
Communication dans un congrès hal-01798976v1
Image document

A multilingual collection of CoNLL-U-compatible morphological lexicons

Benoît Sagot
Eleventh International Conference on Language Resources and Evaluation (LREC 2018), May 2018, Miyazaki, Japan
Communication dans un congrès hal-01798798v2
Image document

CoNLL-UL: Universal Morphological Lattices for Universal Dependency Parsing

Amir More , Özlem Çetinoğlu , Çağri Çöltekin , Nizar Habash , Benoît Sagot
11th Language Resources and Evaluation Conference, May 2018, Miyazaki, Japan
Communication dans un congrès hal-01786125v1
Image document

Reference-less Quality Estimation of Text Simplification Systems

Louis Martin , Samuel Humeau , Pierre-Emmanuel Mazaré , Antoine Bordes , Éric Villemonte de La Clergerie
1st Workshop on Automatic Text Adaptation (ATA), Nov 2018, Tilburg, Netherlands
Communication dans un congrès hal-01959054v2
Image document

Cheating a Parser to Death: Data-driven Cross-Treebank Annotation Transfer

Djamé Seddah , Éric Villemonte de La Clergerie , Benoît Sagot , Hector Martinez Alonso , Marie Candito
Eleventh International Conference on Language Resources and Evaluation (LREC 2018), May 2018, Miyazaki, Japan
Communication dans un congrès hal-01798801v1
Image document

Annotating omission in statement pairs

Héctor Martínez Alonso , Amaury Delamaire , Benoît Sagot
11th Linguistic Annotation Workshop, Apr 2017, Valencia, Spain. pp.41-45
Communication dans un congrès hal-01584035v1
Image document

Speeding up corpus development for linguistic research: language documentation and acquisition in Romansh Tuatschin

Géraldine Walther , Benoît Sagot
Joint SIGHUM Workshop on Computational Linguistics for Cultural Heritage, Social Sciences, Humanities and Literature, Aug 2017, Vancouver, Canada. pp.89 - 94, ⟨10.18653/v1/W17-2212⟩
Communication dans un congrès hal-01570614v1
Image document

Extracting an Etymological Database from Wiktionary

Benoît Sagot
Electronic Lexicography in the 21st century (eLex 2017), Sep 2017, Leiden, Netherlands. pp.716-728
Communication dans un congrès hal-01592061v1
Image document

Construction automatique d'une base de données étymologiques à partir du wiktionary

Benoît Sagot
Traitement Automatique des Langues Naturelles 2017, Jun 2017, Orléans, France
Communication dans un congrès hal-01584013v1
Image document

Improving neural tagging with lexical information

Benoît Sagot , Héctor Martínez Alonso
15th International Conference on Parsing Technologies, Sep 2017, Pisa, Italy. pp.25-31
Communication dans un congrès hal-01592055v1
Image document

The ParisNLP entry at the ConLL UD Shared Task 2017: A Tale of a #ParsingTragedy

Éric Villemonte de La Clergerie , Benoît Sagot , Djamé Seddah
Conference on Computational Natural Language Learning, Aug 2017, Vancouver, Canada. pp.243-252, ⟨10.18653/v1/K17-3026⟩
Communication dans un congrès hal-01584168v1
Image document

Paris and Stanford at EPE 2017: Downstream Evaluation of Graph-based Dependency Representations

Sebastian Schuster , Éric Villemonte de La Clergerie , Marie D Candito , Benoît Sagot , Christopher D Manning
EPE 2017 - The First Shared Task on Extrinsic Parser Evaluation, Sep 2017, Pisa, Italy. pp.47-59
Communication dans un congrès hal-01592051v1
Image document

From Noisy Questions to Minecraft Texts: Annotation Challenges in Extreme Syntax Scenarios

Héctor Alonso Martínez , Djamé Seddah , Benoît Sagot
2nd Workshop on Noisy User-generated Text (W-NUT) at CoLing 2016, Dec 2016, Osaka, Japan
Communication dans un congrès hal-01584054v1

Commentary on Jim Blevins, Implicational Morphology

Benoît Sagot
AnaMorphoSys, Jun 2016, Lyon, France
Communication dans un congrès halshs-01831929v1
Image document

Étiquetage multilingue en parties du discours avec MElt

Benoît Sagot
23ème Conférence sur le Traitement Automatique des Langues Naturelles, Jul 2016, Paris, France
Communication dans un congrès hal-01352243v1
Image document

Could Greek and Italic share a same Indo-European substratum?

Romain Garnier , Benoît Sagot
22nd International Conference on Historical Linguistics, Jul 2015, Naples, Italy
Communication dans un congrès hal-01256310v1

Sentiment analysis of write-in comments related to organisational change

Jūratė Čingienė , Dimitri Tcherniak , Benoît Sagot
17th Congress of the European Association of Work and Organizational Psychology, European Association of Work and Organizational Psychology, May 2015, Oslo, Norway
Communication dans un congrès hal-01285621v1

Segmentation strategies for inflection class inference

Sacha Beniamine , Benoît Sagot
Décembrettes 9, Colloque international de morphologie, Université de Toulouse, Dec 2015, Toulouse, France
Communication dans un congrès hal-01190524v1

Information-theoretic inflectional classification

Sacha Beniamine , Olivier Bonami , Benoît Sagot
1st International Quantitative Morphology Meeting, Jul 2015, Belgrade, Serbia
Communication dans un congrès hal-01178209v1
Image document

Détection et correction automatique d'entités nommées dans des corpus OCRisés

Benoît Sagot , Kata Gábor
Traitement Automatique du Langage Naturel 2014, Jul 2014, Marseille, France
Communication dans un congrès hal-01022378v1
Image document

A Language-Independent Approach to Extracting Derivational Relations from an Inflectional Lexicon

Marion Baranes , Benoît Sagot
Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14), May 2014, Reykjavik, Iceland
Communication dans un congrès hal-01002723v1
Image document

Normalisation de textes par analogie: le cas des mots inconnus

Marion Baranes , Benoît Sagot
TALN - Traitement Automatique du Langage Naturel, Jul 2014, Marseille, France. pp.137-148
Communication dans un congrès hal-01019998v1
Image document

The Opacity-Compactness Tradeoff: Morphomic Features for an Economical Account of Khaling Verbal Inflection

Géraldine Walther , Guillaume Jacques , Benoît Sagot
16th International Morphology Meeting (IMM 16), May 2014, Budapest, Hungary
Communication dans un congrès hal-01114854v1
Image document

Developing a French FrameNet: Methodology and First results

Marie Candito , Pascal Amsili , Lucie Barque , Farah Benamara , Gaël de Chalendar
9th International Conference on Language Resources and Evaluation (LREC 2014), May 2014, Reykjavik, Iceland. pp.1372-1379
Communication dans un congrès hal-01022385v1
Image document

Sous-catégorisation en pour et syntaxe lexicale

Benoît Sagot , Laurence Danlos , Margot Colinet
Traitement Automatique du Langage Naturel 2014, Jul 2014, Marseille, France
Communication dans un congrès hal-01022351v1
Image document

DeLex, a freely-avaible, large-scale and linguistically grounded morphological lexicon for German

Benoît Sagot
Language Resources and Evaluation Conference, European Language Resources Association, May 2014, Reykjavik, Iceland
Communication dans un congrès hal-01022288v1
Image document

A language-independent and fully unsupervised approach to lexicon induction and part-of-speech tagging for closely related languages

Yves Scherrer , Benoît Sagot
Language Resources and Evaluation Conference, European Language Resources Association, May 2014, Reykjavik, Iceland
Communication dans un congrès hal-01022298v1
Image document

YaMTG: An Open-Source Heavily Multilingual Translation Graph Extracted from Wiktionaries and Parallel Corpora

Valérie Hanoka , Benoît Sagot
Language Resources and Evaluation Conference, European Language Resources Association, May 2014, Reykjavik, Iceland
Communication dans un congrès hal-01022306v1
Image document

Avtomatska razširitev in čiščenje sloWNeta

Darja Fišer , Benoît Sagot
Devete konference Jezikovne Tehnologije / Ninth Language Technologies Conference, Oct 2014, Ljubljana, Slovenia
Communication dans un congrès hal-01078839v1
Image document

Automated Error Detection in Digitized Cultural Heritage Documents

Kata Gábor , Benoît Sagot
EACL 2014 Workshop on Language Technology for Cultural Heritage, Apr 2014, Göteborg, Sweden
Communication dans un congrès hal-01022402v1

Les catégories prédicatives dans le Lefff

Benoît Sagot
Journée d'étude " CAtégories Prédicatives et Traitement Automatique des Langues " (CAPTAL), Feb 2014, Lille, France
Communication dans un congrès hal-00943675v1
Image document

Can MDL Improve Unsupervised Chinese Word Segmentation?

Pierre Magistry , Benoît Sagot
Sixth International Joint Conference on Natural Language Processing: Sighan workshop, Oct 2013, Nagoya, Japan. pp.2
Communication dans un congrès hal-00876389v1

Uncovering the inner architecture of Khaling verbal morphology

Géraldine Walther , Guillaume Jacques , Benoît Sagot
3rd Workshop on Sino-Tibetan Languages of Sichuan, Sep 2013, Paris, France
Communication dans un congrès hal-00927278v1
Image document

Lexicon induction and part-of-speech tagging of non-resourced languages without any bilingual resources

Yves Scherrer , Benoît Sagot
RANLP Workshop on Adaptation of language resources and tools for closely related languages and language variants, Sep 2013, Hissar, Bulgaria
Communication dans un congrès hal-00862693v1
Image document

Extension dynamique de lexiques morphologiques pour le français à partir d'un flux textuel

Benoît Sagot , Damien Nouvel , Virginie Mouilleron , Marion Baranes
TALN - Traitement Automatique du Langage Naturel, Jun 2013, Les sables d'Olonne, France. pp.407-420
Communication dans un congrès hal-00832078v1
Image document

Comparing Complexity Measures

Benoît Sagot
Computational approaches to morphological complexity, Surrey Morphology Group, Feb 2013, Paris, France
Communication dans un congrès hal-00927276v1
Image document

Étiquetage morphosyntaxique de langues non dotées à partir de ressources pour une langue étymologiquement proche

Yves Scherrer , Benoît Sagot
Atelier TALARE, TALN 2013, ATALA, Jun 2013, Les Sables d'Olonne, France
Communication dans un congrès hal-00838569v1
Image document

Implementing a formal model of inflectional morphology

Benoît Sagot , Géraldine Walther
Third International Workshop on Systems and Frameworks for Computational Morphology, Humboldt-Universität, Sep 2013, Berlin, Germany. pp.115-134, ⟨10.1007/978-3-642-40486-3_7⟩
Communication dans un congrès hal-00927277v1
Image document

Enforcing Subcategorization Constraints in a Parser Using Sub-parses Recombining

Seyed Abolghasem Mirroshandel , Alexis Nasr , Benoît Sagot
NAACL 2013 - Conference of the North American Chapter of the Association for Computational Linguistics, Jun 2013, Atlanta, United States
Communication dans un congrès hal-00936492v1
Image document

The Alpage Architecture at the SANCL 2012 Shared Task: Robust Pre-Processing and Lexical Bridging for User-Generated Content Parsing

Djamé Seddah , Benoît Sagot , Marie Candito
SANCL 2012 - First Workshop on Syntactic Analysis of Non-Canonical Language an NAACL-HLT'12 workshop, Jun 2012, Montréal, Canada
Communication dans un congrès hal-00703124v2
Image document

Merging syntactic lexica: the case for French verbs

Benoît Sagot , Laurence Danlos
LREC'12 Workshop on Merging Language Resources, May 2012, Istanbul, Turkey
Communication dans un congrès hal-00703128v1

Building a treebank of noisy user-generated content: The French Social Media Bank

Djamé Seddah , Benoît Sagot , Marie Candito , Virginie Mouilleron , Vanessa Combet
TLT 11 - The 11th International Workshop on Treebanks and Linguistic Theories, Nov 2012, Lisbonne, Portugal
Communication dans un congrès hal-00780898v1
Image document

Population of a Knowledge Base for News Metadata from Unstructured Text and Web Data

Rosa Stern , Benoît Sagot
AKBC-WEKEX 2012 - The Knowledge Extraction Workshop at NAACL-HLT 2012, Jun 2012, Montréal, Canada
Communication dans un congrès hal-00699297v1
Image document

Dictionary-Ontology Cross-Enrichment Using TLFi and WOLF to enrich one another

Emmanuel Eckard , Lucie Barque , Alexis Nasr , Benoît Sagot
CogALex-III - 3rd Workshop on Cognitive Aspects of the Lexicon, Dec 2012, Mumbai, India
Communication dans un congrès hal-00936500v1

Unsupervized Word Segmentation: the case for Mandarin Chinese

Pierre Magistry , Benoît Sagot
ACL - Annual Meeting of the Association for Computational Linguistics - 2012, ACL, Jul 2012, Jeju, South Korea
Communication dans un congrès hal-00701200v1
Image document

Cleaning noisy wordnets

Benoît Sagot , Darja Fišer
LREC 2012 - Eighth International Conference on Language Resources and Evaluation, May 2012, Istanbul, Turkey
Communication dans un congrès hal-00703125v1

Data Driven Lemmatization for Statistical Constituent Parsing of Italian

Djamé Seddah , Joseph Le Roux , Benoît Sagot
Proceedings of EVALITA 2011, Jan 2012, Roma, Italy, Italy
Communication dans un congrès hal-00702618v1

Data Driven Lemmatization and Parsing of Italian

Djamé Seddah , Joseph Le Roux , Benoît Sagot
EVALITA 2011 - Evaluation of NLP and Speech Tools for Italian, Jan 2012, Rome, Italy. pp.249-256, ⟨10.1007/978-3-642-35828-9_27⟩
Communication dans un congrès hal-00778153v1
Image document

Wordnet creation and extension made simple: A multilingual lexicon-based approach using wiki resources

Valérie Hanoka , Benoît Sagot
LREC 2012 : 8th international conference on Language Resources and Evaluation, May 2012, Istanbul, Turkey. pp.6
Communication dans un congrès hal-00701606v1
Image document

Statistical Parsing of Spanish and Data Driven Lemmatization

Joseph Le Roux , Benoît Sagot , Djamé Seddah
ACL 2012 Joint Workshop on Statistical Parsing and Semantic Processing of Morphologically Rich Languages (SP-Sem-MRL 2012), Jul 2012, Jeju, South Korea. 6 p
Communication dans un congrès hal-00702496v1
Image document

Boosting the Coverage of a Semantic Lexicon by Automatically Extracted Event Nominalizations

Kata Gábor , Marianna Ma Apidianaki , Benoît Sagot , Éric Villemonte de La Clergerie
LREC 2012 - Eighth International Conference on Language Resources and Evaluation, May 2012, Istanbul, Turkey
Communication dans un congrès hal-00703127v1
Image document

The French Social Media Bank: a Treebank of Noisy User Generated Content

Djamé Seddah , Benoît Sagot , Marie Candito , Virginie Mouilleron , Vanessa Combet
COLING 2012 - 24th International Conference on Computational Linguistics, Kay, Martin and Boitet, Christian, Dec 2012, Mumbai, India
Communication dans un congrès hal-00780895v1
Image document

Evaluating and improving syntactic lexica by plugging them within a parser

Elsa Tolone , Benoît Sagot , Éric Villemonte de La Clergerie
LREC 2012 - 8th International Conference on Language Resources and Evaluation, May 2012, Istambul, Turkey. electronic version (8 pp.)
Communication dans un congrès hal-00786883v1
Image document

Applying cross-lingual WSD to wordnet development

Marianna Ma Apidianaki , Benoît Sagot
LREC 2012 - Eighth International Conference on Language Resources and Evaluation, May 2012, Istanbul, Turkey
Communication dans un congrès hal-00703126v1
Image document

Annotation référentielle du Corpus Arboré de Paris 7 en entités nommées

Benoît Sagot , Marion Richard , Rosa Stern
Traitement Automatique des Langues Naturelles (TALN), Jun 2012, Grenoble, France
Communication dans un congrès hal-00703108v1
Image document

Aleda, a free large-scale entity database for French

Benoît Sagot , Rosa Stern
LREC 2012 : eighth international conference on Language Resources and Evaluation, May 2012, Istanbul, Turkey. 4 p
Communication dans un congrès hal-00699300v1
Image document

Automatic Extension of WOLF

Benoît Sagot , Darja Fišer
GWC2012 - 6th International Global Wordnet Conference, Global Wordnet Association + Toyohashi University of Technology + National Institute of Japanese Language and Linguistics, Jan 2012, Matsue, Japan
Communication dans un congrès hal-00655774v1
Image document

A Joint Named Entity Recognition and Entity Linking System

Rosa Stern , Benoît Sagot , Frédéric Béchet
EACL 2012 Workshop on Innovative hybrid approaches to the processing of textual data, Apr 2012, Avignon, France
Communication dans un congrès hal-00699295v1

Boosting the coverage of a semantic lexicon by automatically extracted event nominalizations

Kata Gábor , Marianna Apidianaki , B Sagot , Éric Villemonte de La Clergerie
International Conference on Language Resources and Evaluation, Jan 2012, Istanbul, Turkey
Communication dans un congrès hal-01838570v1
Image document

TCOF-POS : un corpus libre de français parlé annoté en morphosyntaxe

Christophe Benzitoun , Karen Fort , Benoît Sagot
JEP-TALN 2012 - Journées d'Études sur la Parole et conférence annuelle du Traitement Automatique des Langues Naturelles, Jun 2012, Grenoble, France. pp.99-112
Communication dans un congrès hal-00709187v1
Image document

Construction d'un lexique des adjectifs dénominaux

Jana Strnadová , Benoît Sagot
TALN'2011 - Traitement Automatique des Langues Naturelles, Montpellier, Jun 2011, Montpellier, France. pp.69-74
Communication dans un congrès halshs-00751177v1
Image document

Évaluation de lexiques syntaxiques par leur intégration dans l'analyseur syntaxique FRMG

Elsa Tolone , Éric Villemonte de La Clergerie , Benoît Sagot
LGC'11 - 30ème Colloque international sur le Lexique et la Grammaire, Oct 2011, Nicosie, Chypre. p. 267-274
Communication dans un congrès hal-00605690v1
Image document

Coopération de méthodes statistiques et symboliques pour l'adaptation non-supervisée d'un système d'étiquetage en entités nommées

Frédéric Béchet , Benoît Sagot , Rosa Stern
TALN'2011 - Traitement Automatique des Langues Naturelles, Jun 2011, Montpellier, France
Communication dans un congrès inria-00617068v1
Image document

Non-Canonical Inflection: Data, Formalisation and Complexity Measures

Benoît Sagot , Géraldine Walther
SFCM 2011 - The Second Workshop on Systems and Frameworks for Computational Morphology, Aug 2011, Zürich, Switzerland. pp.23-45, ⟨10.1007/978-3-642-23138-4⟩
Communication dans un congrès inria-00615306v1
Image document

On the predictability of light verbs

Pollet Samvelian , Laurence Danlos , Benoît Sagot
30th International Conference on Lexis and Grammar, 2011, Nicosia, Cyprus
Communication dans un congrès inria-00617506v1
Image document

Développement de ressources pour le persan : le nouveau lexique morphologique PerLex 2 et l'étiqueteur morphosyntaxique MElt-fa

Benoît Sagot , Géraldine Walther , Pegah Faghiri , Pollet Samvelian
TALN 2011 - Traitement Automatique des Langues Naturelles, Jun 2011, Montpellier, France
Communication dans un congrès inria-00614710v1

Développement de ressources pour le persan: le nouveau lexique morphologique \perlex 2 et l'étiqueteur morphosyntaxique \meltfa

Benoît Sagot , Géraldine Walther , Pegah Faghiri , Pollet Samvelian
Actes de TALN 2011, 2011, Montpellier, France
Communication dans un congrès halshs-01441123v1
Image document

Un turc mécanique pour les ressources linguistiques : critique de la myriadisation du travail parcellisé

Benoît Sagot , Karen Fort , Gilles Adda , Joseph Mariani , Bernard Lang
TALN'2011 - Traitement Automatique des Langues Naturelles, Jun 2011, Montpellier, France
Communication dans un congrès inria-00617067v1
Image document

A new morphological lexicon and a POS tagger for the Persian Language

Benoît Sagot , Géraldine Walther , Pegah Faghiri , Pollet Samvelian
International Conference in Iranian Linguistics, 2011, Uppsala, Sweden
Communication dans un congrès inria-00614711v1

Non-canonical inflection : data, formalisation and complexity measures.

Benoît Sagot , Géraldine Walther
Systems and Frameworks for Computational Morphology, 2011, France. pp.23-45
Communication dans un congrès halshs-00746299v1
Image document

Extending wordnets by learning from multiple resources

Benoît Sagot , Darja Fišer,
LTC'11 : 5th Language and Technology Conference, Nov 2011, Poznań, Poland
Communication dans un congrès hal-00655785v1
Image document

Crowdsourcing for Language Resource Development: Critical Analysis of Amazon Mechanical Turk Overpowering Use

Gilles Adda , Benoît Sagot , Karen Fort , Joseph Mariani
5th Language and Technology Conference, Nov 2011, Poznan, Poland
Communication dans un congrès hal-00648187v1
Image document

Problèmes d'intégration morphologique d'emprunts d'origine anglaise en français

Géraldine Walther , Benoît Sagot
30th International Conference on Lexis and Grammar, Oct 2011, Nicosia, Chypre
Communication dans un congrès inria-00616779v1
Image document

Développement de ressources pour le persan: PerLex2, nouveau lexique morphologique et MElt_fa, étiqueteur morphosyntaxique

Benoît Sagot , Géraldine Walther , Pegah Faghiri , Pollet Samvelian
TALN 2011, 2011, Montpellier, France
Communication dans un congrès halshs-00751630v1

Segmentation et induction de lexique non-supervisées du mandarin

Pierre Magistry , Benoît Sagot
TALN'2011 - Traitement Automatique des Langues Naturelles, ATALA, Jun 2011, Montpellier, France
Communication dans un congrès inria-00605899v1
Image document

Analyse discursive des incises de citation

Laurence Danlos , Benoît Sagot , Rosa Stern
2ème Congrès Mondial de Linguistique Française - CMLF 2010, Institut de Linguistique Française, Jul 2010, La Nouvelle Orléans, États-Unis
Communication dans un congrès inria-00511397v1
Image document

Resources for Named Entity Recognition and Resolution in News Wires

Rosa Stern , Benoît Sagot
Entity 2010 Workshop at LREC 2010, May 2010, Valletta, Malta
Communication dans un congrès inria-00521240v1
Image document

Fast Development of Basic NLP Tools: Towards a Lexicon and a POS Tagger for Kurmanji Kurdish

Géraldine Walther , Benoît Sagot , Karen Fort
International Conference on Lexis and Grammar, Sep 2010, Belgrade, Serbia
Communication dans un congrès hal-00510999v1
Image document

Développement de ressources pour le persan: lexique morphologique et chaîne de traitements de surface

Benoît Sagot , Géraldine Walther
TALN 2010, Jul 2010, Montréal, Canada
Communication dans un congrès halshs-00751169v1
Image document

Détection et résolution d'entités nommées dans des dépêches d'agence

Rosa Stern , Benoît Sagot
Traitement Automatique des Langues Naturelles : TALN 2010, Jul 2010, Montréal, Canada
Communication dans un congrès inria-00521234v1
Image document

Traitement des inconnus : une approche systématique de l'incomplétude lexicale

Helena Blancafort San José , Gaëlle Recourcé , Javier Couto , Benoît Sagot , Rosa Stern
Traitement Automatique des Langues Naturelles : TALN 2010, Jul 2010, Montréal, Canada
Communication dans un congrès inria-00521237v1
Image document

Developing a Large-Scale Lexicon for a Less-Resourced Language: General Methodology and Preliminary Experiments on Sorani Kurdish

Géraldine Walther , Benoît Sagot
Proceedings of the 7th SaLTMiL Workshop on Creation and use of basic lexical resources for less-resourced languages (LREC 2010 Workshop), 2010, Valetta, Malta
Communication dans un congrès halshs-00751634v1
Image document

Exploitation d'une ressource lexicale pour la construction d'un étiqueteur morphosyntaxique état-de-l'art du français

Pascal Denis , Benoît Sagot
Traitement Automatique des Langues Naturelles : TALN 2010, Jul 2010, Montréal, Canada
Communication dans un congrès inria-00521231v1
Image document

Verbes de citation et Tables du Lexique-Grammaire

Benoît Sagot , Laurence Danlos
International Conference on Lexis and Grammar, Sep 2010, Belgrade, Serbie
Communication dans un congrès inria-00521229v1
Image document

Ponctuations fortes abusives

Laurence Danlos , Benoît Sagot
Traitement Automatique des Langues Naturelles : TALN 2010, Jul 2010, Montréal, Canada
Communication dans un congrès inria-00521235v1
Image document

A morphological lexicon for the Persian language

Benoît Sagot , Géraldine Walther
Proceedings of the 7th Language Resources and Evaluation Conference (LREC'10), May 2010, La Valette, Malta
Communication dans un congrès halshs-00751629v1
Image document

Control Verbs, Argument Cluster Coordination and MCTAG

Djamé Seddah , Benoît Sagot , Laurence Danlos
10th International Conference on Tree Adjoining Grammars and Related Formalisms (TAG+10), 2010, New Haven, United States. pp.0
Communication dans un congrès inria-00521230v1
Image document

The Lefff, a freely available and large-coverage morphological and syntactic lexicon for French

Benoît Sagot
7th international conference on Language Resources and Evaluation (LREC 2010), May 2010, Valletta, Malta
Communication dans un congrès inria-00521242v1
Image document

Optimal rank reduction for Linear Context-Free Rewriting Systems with Fan-Out Two

Benoît Sagot , Giorgio Satta
48th Annual Meeting of the Association for Computational Linguistics - ACL 2010, Jul 2010, Uppsala, Sweden
Communication dans un congrès inria-00515455v3
Image document

Creating and maintaining language resources: the main guidelines of the Victoria project

Lionel Nicolas , Miguel A. Molinero , Benoît Sagot , Nieves Fernández Formoso , Vanesa Vidal Castro
Workshop on Language Resources: From Storyboard to Sustainability and LR Lifecycle Management (LREC 2010 workshop), May 2010, Valletta, Malta
Communication dans un congrès inria-00521241v1
Image document

Influence of Pre-annotation on POS-tagged Corpus Development

Karen Fort , Benoît Sagot
The Fourth ACL Linguistic Annotation Workshop, Jul 2010, Uppsala, Sweden. pp.56-63
Communication dans un congrès hal-00484294v1

Exploitation d'une ressource lexicale pour la construction d'un étiqueteur morpho-syntaxique état-de-l'art du français

Pascal Denis , Benoît Sagot
Traitement automatique des langues naturelles, Association pour le Traitement Automatique des Langues, Jul 2010, Montréal, Canada
Communication dans un congrès inria-00514364v1
Image document

A Lexicon of French Quotation Verbs for Automatic Quotation Extraction

Benoît Sagot , Laurence Danlos , Rosa Stern
7th international conference on Language Resources and Evaluation - LREC 2010, May 2010, Valetta, Malta
Communication dans un congrès inria-00515461v1
Image document

Trouver et confondre les coupables : un processus sophistiqué de correction de lexique

Lionel Nicolas , Benoît Sagot , Miguel A. Molinero , Jacques Farré , Éric Villemonte de La Clergerie
16ème conférence sur le Traitement Automatique des Langues Naturelles : TALN'09, ATALA ; LIPN, Jun 2009, Senlis, France
Communication dans un congrès inria-00553257v1
Image document

FRMG: évolutions d'un analyseur syntaxique TAG du français

Éric Villemonte de La Clergerie , Benoît Sagot , Lionel Nicolas , Marie-Laure Guénot
Journée de l'ATALA sur : Quels analyseurs syntaxiques pour le français ?, ATALA, Oct 2009, Paris, France
Communication dans un congrès inria-00553260v1

Construcciòn y extensiòn de un léxico morfológico y sintáctico para el Español: el Leffe

Lionel Nicolas , Miguel A. Molinero , Benoît Sagot , Elena Sánchez Trigo , Éric Villemonte de La Clergerie
Proceedings of SEPLN 09, 2009, San Sebastian, Spain, España
Communication dans un congrès inria-00553258v1

Towards efficient production of linguistic resources: the Victoria Project

Lionel Nicolas , Miguel A. Molinero , Benoît Sagot , Elena Sánchez Trigo , Éric Villemonte de La Clergerie
Proceedings of the International Conference RANLP-2009, 2009, Borovets, Bulgaria, Bulgaria. pp.318--323
Communication dans un congrès inria-00553259v1
Image document

Parsing Directed Acyclic Graphs with Range Concatenation Grammars

Pierre Boullier , Benoît Sagot
International Conference on Parsing Technologies (IWPT 2009), 2009, Paris, France
Communication dans un congrès inria-00616690v1
Image document

Extending the Adverbial Coverage of a French WordNet

Benoît Sagot , Karen Fort , Fabienne Venant
NODALIDA 2009 workshop on WordNets and other Lexical Semantic Resources, May 2009, Odense, Denmark. pp.0
Communication dans un congrès hal-00402305v1
Image document

Using Lexicon-Grammar Tables for French Verbs in a Large-Coverage Parser

Elsa Tolone , Benoît Sagot
LTC 2009 - 4th Language and Technology Conference, Nov 2009, Poznań, Poland. pp.183-191, ⟨10.1007/978-3-642-20095-3_17⟩
Communication dans un congrès inria-00607488v1

Building a morphological and syntactic lexicon by merging various linguistic resources

Miguel A. Molinero , Benoît Sagot , Lionel Nicolas
NODALIDA 2009 - the 17th Nordic Conference of Computational Linguistics, May 2009, Odense, Denmark
Communication dans un congrès hal-00793048v1
Image document

A morphological and syntactic wide-coverage lexicon for Spanish: The Leffe

Miguel A. Molinero , Benoît Sagot , Lionel Nicolas
RANLP 2009 - Recent Advances in Natural Language Processing, Sep 2009, Borovets, Bulgaria
Communication dans un congrès inria-00616693v1
Image document

Description et analyse des verbes désadjectivaux et dénominaux en -ifier et -iser

Benoît Sagot , Karen Fort
28ème Colloque international sur le lexique et la grammaire (LGC'09), Sep 2009, Bergen, Norvège. pp.102-109
Communication dans un congrès hal-00402451v1

Producción eficiente de recursos lingüísticos: el proyecto Victoria

Lionel Nicolas , Miguel A. Molinero , Benoît Sagot , Elena Sánchez Trigo , Éric Villemonte de La Clergerie
SEPLN 09 - 25th edition of the Annual Conference of the Spanish Society for Natural Language Processing, Sep 2009, Donostia, España
Communication dans un congrès hal-00793059v1
Image document

Multi-Component Tree Insertion Grammars

Pierre Boullier , Benoît Sagot
FG 2009 - 14 th Conference on Formal Grammars, 2009, Bordeaux, France
Communication dans un congrès inria-00616691v1
Image document

MICA: A Probabilistic Dependency Parser Based on Tree Insertion Grammars

Srinivas Bangalore , Pierre Boullier , Alexis Nasr , Owen Rambow , Benoît Sagot
NAACL 2009 - North American Chapter of the Association for Computational Linguistics (Short Papers), 2009, Boulder, Colorado, United States
Communication dans un congrès inria-00616695v1
Image document

Extracting and Visualizing Quotations from News Wires

Éric Villemonte de La Clergerie , Benoît Sagot , Rosa Stern , Pascal Denis , Gaëlle Recourcé
LTC 2009 - 4th Language and Technology Conference, Nov 2009, Poznań, Poland. pp.522-532, ⟨10.1007/978-3-642-20095-3_48⟩
Communication dans un congrès inria-00607463v1

Constructing parse forests that include exactly the n-best PCFG trees

Pierre Boullier , Alexis Nasr , Benoît Sagot
IWPT'09 - 11th International Conference on Parsing Technologies, Oct 2009, Paris, France
Communication dans un congrès inria-00616688v1

Coupling an annotated corpus and a morphosyntactic lexicon for state-of-the-art POS tagging with less human effort

Pascal Denis , Benoît Sagot
Pacific Asia Conference on Language, Information and Computation, 2009, Hong Kong, China
Communication dans un congrès inria-00514366v1
Image document

Intégrer les tables du Lexique-Grammaire à un analyseur syntaxique robuste à grande échelle

Benoît Sagot , Elsa Tolone
Conférence sur le Traitement Automatique des Langues Naturelles (TALN'09), Jun 2009, Senlis, France. electronic version (10 pp.)
Communication dans un congrès hal-00461893v1
Image document

Combining multiple resources to build reliable wordnets

Darja Fišer, , Benoît Sagot
TSD 2008 - Text Speech and Dialogue, 2008, Brno, Czech Republic
Communication dans un congrès inria-00614706v1
Image document

Méthodologie lexicographique de constitution d'un lexique syntaxique de référence pour le français

Laurence Danlos , Benoît Sagot
Proceedings of the workshop ``Lexicographie et informatique~: bilan et perspectives'', Jan 2008, Nancy, France
Communication dans un congrès inria-00524742v1
Image document

Construction d'un wordnet libre du français à partir de ressources multilingues

Benoît Sagot , Darja Fišer
TALN 2008 -Traitement Automatique des Langues Naturelles, Jun 2008, Avignon, France
Communication dans un congrès inria-00614707v1
Image document

Extensión y corrección semi-automática de léxicos morfo-sintácticos

Lionel Nicolas , Benoît Sagot , Miguel A. Molinero , Jacques Farré , Éric Villemonte de La Clergerie
24th edition of the conference of the Spanish Society for Natural Language Processing (SEPLN 2008), El Advanced Database research group, LaBDA, Sep 2008, Madrid, España
Communication dans un congrès inria-00553523v1
Image document

Extension et couplage de ressources syntaxiques et sémantiques sur les adverbes

Benoît Sagot , Karen Fort , Fabienne Venant
27e Colloque international sur le lexique et la grammaire 2008, Sep 2008, L'Aquila, Italie. pp.0
Communication dans un congrès hal-00336294v1
Image document

Computer aided correction and extension of a syntactic wide-coverage lexicon

Lionel Nicolas , Benoît Sagot , Miguel A. Molinero , Jacques Farré , Éric Villemonte de La Clergerie
Coling 2008, Aug 2008, Manchester, United Kingdom. pp 604-611
Communication dans un congrès hal-00360918v1
Image document

Building a free French wordnet from multilingual resources

Benoît Sagot , Darja Fišer
OntoLex, May 2008, Marrakech, Morocco
Communication dans un congrès inria-00614708v1
Image document

Constructions pronominales dans Dicovalence et le lexique-grammaire--intégration dans le Lefff

Laurence Danlos , Benoît Sagot
Proceedings of the 27th Lexicon-Grammar Conference, 2008, L'Aquila, Italie
Communication dans un congrès inria-00524741v1
Image document

Améliorer un lexique syntaxique à l'aide des tables du Lexique-Grammaire : Adverbes en -ment

Benoît Sagot , Karen Fort
26e Colloque International sur le Lexique et la grammaire 2007, Oct 2007, Bonifacio, France
Communication dans un congrès inria-00186779v1
Image document

Building a Morphosyntactic Lexicon and a Pre-syntactic Processing Chain for Polish

Benoît Sagot
Language and Technology Conference, 2007, Poznań, Poland. ⟨10.1007/978-3-642-04235-5_8⟩
Communication dans un congrès inria-00614709v1

Mining Parsing Results for Lexical Correction: Toward a Complete Correction Process of Wide-Coverage Lexicons

Lionel Nicolas , Benoît Sagot , Miguel A. Molinero , Jacques Farré , Éric Villemonte de La Clergerie
LTC 2007 - Third Language and Technology Conference, Oct 2007, Poznan, Poland. pp.178-191, ⟨10.1007/978-3-642-04235-5_16⟩
Communication dans un congrès hal-00793052v1
Image document

The Lefff 2 syntactic lexicon for French: architecture, acquisition, use

Benoît Sagot , Lionel Clément , Éric Villemonte de La Clergerie , Pierre Boullier
LREC 06, 2006, Gênes, Italy. pp.1-4
Communication dans un congrès hal-00413071v1
Image document

Modeling and Analysis of Elliptic Coordination by Dynamic Exploitation of Derivation Forests in LTAG Parsing

Djamé Seddah , Benoît Sagot
Proceedings of TAG+8 : The Eighth International Workshop on Tree Adjoining Grammar and Related Formalisms, 2006, Sydney, Australia
Communication dans un congrès inria-00545430v1

French frozen verbal expressions: from lexicon-grammar tables to NLP applications.

Benoît Sagot , Laurence Danlos , Susanne Salmon-Alt
Colloque Lexique et Grammaire 2006, 2006, Palerme, Italy
Communication dans un congrès hal-00110974v1
Image document

Modélisation et analyse des coordinations elliptiques par l'exploitation dynamique des forêts de dérivation

Djamé Seddah , Benoît Sagot
Proceedings of TALN 2006 : Traitement Automatique des Langues Naturelles, 2006, Leuven, Belgium. pp.609-618
Communication dans un congrès inria-00545437v1
Image document

Error mining in parsing results

Benoît Sagot , Éric Villemonte de La Clergerie
The 21st International Conference of the Association for Computational Linguistics (ACL 2006), Jul 2006, Sydney, Australia. pp.329-336
Communication dans un congrès hal-02270412v1
Image document

Un analyseur LFG efficace pour le français: SxLfg

Pierre Boullier , Benoît Sagot , Lionel Clément
Ttraitement Automatique des Langues Naturelles, 2005, Dourdan, France. pp.403-408
Communication dans un congrès hal-00413077v1
Image document

Efficient LFG parsing: SxLfg

Pierre Boullier , Benoît Sagot
International Workshop on Parsing Technologies, 2005, Vancouver, Canada. pp.1-10
Communication dans un congrès inria-00001060v1
Image document

Chaînes de traitement syntaxique

Pierre Boullier , Lionel Clément , Benoît Sagot , Éric Villemonte de La Clergerie
TALN 05, 2005, Dourdan, France. pp.103-112
Communication dans un congrès hal-00413183v1
Image document

Vers un méta-lexique pour le français: architecture, acquisition, utilisation

Benoît Sagot , Lionel Clément , Éric Villemonte de La Clergerie , Pierre Boullier
Journée ATALA sur l'interface lexique-grammaire, 2005, Paris, France
Communication dans un congrès hal-00413192v1
Image document

Simple comme EASy

Pierre Boullier , Lionel Clément , Éric Villemonte de La Clergerie , Benoît Sagot
TALN 05, 2005, Dourdan, France. pp.57-60
Communication dans un congrès hal-00413186v1
Image document

Morphology based automatic acquisition of large-coverage lexica

Lionel Clément , Bernard Lang , Benoît Sagot
LREC 04, 2004, Lisbonne, Portugal. pp.1841-1844
Communication dans un congrès hal-00413189v1

A new PIE root *h1er ‘(to be/become) dark red’

Benoît Sagot
Romain Garnier. Loanwords and Substrata, 164, 2020, Innsbrucker Beiträge zur Sprachwissenschaft, 9783851247510
Chapitre d'ouvrage hal-03874266v1

New results on a centrum substratum in Greek: the Lydian connection

Romain Garnier , Benoît Sagot
Romain Garnier. Loanwords and Substrata, 164, 2020, Innsbrucker Beiträge zur Sprachwissenschaft, 9783851247510
Chapitre d'ouvrage hal-03874264v1
Image document

Milk and the Indo-Europeans

Romain Garnier , Laurent Sagart , Benoît Sagot
Martine Robeets; Alexander Savalyev Language Dispersal Beyond Farming, John Benjamins Publishing Company, pp.291-311, 2017, 978 90 272 1255 9. ⟨10.1075/z.215.13gar⟩
Chapitre d'ouvrage hal-01667476v1
Image document

Crowdsourcing for Language Resource Development: Criticisms About Amazon Mechanical Turk Overpowering Use

Karen Fort , Gilles Adda , Benoît Sagot , Joseph Mariani , Alain Couillault
Vetulani, Zygmunt and Mariani, Joseph. Human Language Technology Challenges for Computer Science and Linguistics, 8387, Springer International Publishing, pp.303-314, 2014, Lecture Notes in Computer Science, 978-3-319-08957-7. ⟨10.1007/978-3-319-08958-4_25⟩
Chapitre d'ouvrage hal-01053047v1

Construction de ressources lexicales pour le traitement automatique des langues

Benoît Sagot
Núria Gala and Michael Zock. Ressources Lexicales -- Contenu, construction, utilisation, évaluation, 30, John Benjamins, pp.217-254, 2013, Lingvisticæ Investigationes Supplementa
Chapitre d'ouvrage hal-00927281v1

Are Very Large Context-Free Grammars Tractable?

Pierre Boullier , Benoît Sagot
Harry Bunt, Paola Merlo, Joakim Nivre. Trends in Parsing Technology, 43, Springer, 2010, Text, Speech and Language Technology, 978-90-481-9351-6
Chapitre d'ouvrage inria-00516341v1

SpiRit-LM: Interleaved Spoken and Written Language Model

Tu Anh Nguyen , Benjamin Muller , Bokai Yu , Marta R. Costa-Jussa , Maha Elbayad
2024
Pré-publication, Document de travail hal-04449905v1
Image document

Making Sentence Embeddings Robust to User-Generated Content

Lydia Nishimwe , Benoît Sagot , Rachel Bawden
2024
Pré-publication, Document de travail hal-04520909v1

Headless Language Models: Learning without Predicting with Contrastive Weight Tying

Nathan Godey , Eric Villemonte de La Clergerie , Benoît Sagot
2023
Pré-publication, Document de travail hal-04264051v1

SONAR: Sentence-Level Multimodal and Language-Agnostic Representations

Paul-Ambroise Duquenne , Holger Schwenk , Benoît Sagot
2023
Pré-publication, Document de travail hal-04264028v1

A Simple Method for Unsupervised Bilingual Lexicon Induction for Data-Imbalanced, Closely Related Language Pairs

Niyati Bafna , Cristina España-Bonet , Josef van Genabith , Benoît Sagot , Rachel Bawden
2023
Pré-publication, Document de travail hal-04264052v1

Is Anisotropy Inherent to Transformers?

Nathan Godey , Eric Villemonte de La Clergerie , Benoît Sagot
2023
Pré-publication, Document de travail hal-04264026v1
Image document

BLOOM: A 176B-Parameter Open-Access Multilingual Language Model

Teven Le Scao , Angela Fan , Christopher Akiki , Ellie Pavlick , Suzana Ilić
2023
Pré-publication, Document de travail hal-03850124v1

MaskEval: Weighted MLM-Based Evaluation for Text Summarization and Simplification

Yu Lu Liu , Rachel Bawden , Thomas Scialom , Benoît Sagot , Jackie Chi Kit Cheung
2022
Pré-publication, Document de travail hal-03834733v1

Between words and characters: A Brief History of Open-Vocabulary Modeling and Tokenization in NLP

Sabrina J. Mielke , Zaid Alyafeai , Elizabeth Salesky , Colin Raffel , Manan Dey
2022
Pré-publication, Document de travail hal-03540069v1

Generative Spoken Dialogue Language Modeling: preprint version

Tu Anh Nguyen , Eugene Kharitonov , Jade Copet , Yossi Adi , Wei-Ning Hsu
2022
Pré-publication, Document de travail hal-03834730v1

Rethinking Automatic Evaluation in Sentence Simplification

Thomas Scialom , Louis Martin , Jacopo Staiano , Eric Villemonte de La Clergerie , Benoît Sagot
2021
Pré-publication, Document de travail hal-03199901v1

Multilingual Unsupervised Sentence Simplification

Louis Martin , Angela Fan , Eric Villemonte de La Clergerie , Antoine Bordes , Benoît Sagot
2021
Pré-publication, Document de travail hal-03109299v1

First Align, then Predict: Understanding the Cross-Lingual Ability of Multilingual BERT

Benjamin Muller , Yanai Elazar , Benoît Sagot , Djamé Seddah
2021
Pré-publication, Document de travail hal-03161685v1

Can Multilingual Language Models Transfer to an Unseen Dialect? A Case Study on North African Arabizi

Benjamin Muller , Benoît Sagot , Djamé Seddah
2021
Pré-publication, Document de travail hal-03161677v1

When Being Unseen from mBERT is just the Beginning: Handling New Languages With Multilingual Language Models

Benjamin Muller , Antonis Anastasopoulos , Benoît Sagot , Djamé Seddah
2020
Pré-publication, Document de travail hal-03109106v1

CamemBERT: a Tasty French Language Model

Louis Martin , Benjamin Muller , Pedro Javier Ortiz Suárez , Yoann Dupont , Laurent Romary
2019
Pré-publication, Document de travail hal-02445946v1

Controllable Sentence Simplification

Louis Martin , Benoît Sagot , Éric Villemonte de La Clergerie , Antoine Bordes
2019
Pré-publication, Document de travail hal-02445874v1
Image document

Modeling German Verb Argument Structures: LSTMs vs. Humans

Charlotte Rochereau , Benoît Sagot , Emmanuel Dupoux
2019
Pré-publication, Document de travail hal-02417640v1
Image document

Informatiser le lexique

Benoît Sagot
Informatique et langage [cs.CL]. Sorbonne Université, 2018
HDR tel-01895229v1