- 85
- 48
- 37
- 9
- 6
- 3
- 2
- 2
- 1
- 1
- 1
- 1
- 1
François Yvon
197
Documents
Affiliations actuelles
- 1085231
Identifiants chercheurs
- francois-yvon
- 0000-0002-7972-7442
- IdRef : 057593531
- Google Scholar : https://scholar.google.fr/citations?user=JjfDvawAAAAJ
- Arxiv : yvon_f_1
Présentation
I am senior researcher at the [ISIR (Sorbonne Université and CNRS)](http://www.isir.upmc.fr/?lang=en), within the [Machine Learning and deep learning for Information Access](https://www.isir.upmc.fr/teams/mlia/?lang=en)
**My main research topics:** statistical Multilingual Natural Language Processing + [Machine Translation](http://www.limsi.fr/Scientifique/tlp/mt) + Speech Recognition + Text Mining + Language Modeling) + analogy-based learning for NLP.
Je suis chercheur à l'[ISIR (Sorbonne Université and CNRS](http://www.isir.upmc.fr/), dans le groupe [MLIA](https://www.isir.upmc.fr/teams/mlia/). Mes principaux thèmes de recherche concernent le traitement automatique des langues naturelles dans un contexte multilingue, et plus précisément: la traduction automatique - la fouille de textes - les modèles de langues - l'apprentissage par analogie.
Publications
- 23
- 13
- 12
- 11
- 6
- 6
- 5
- 5
- 5
- 5
- 5
- 4
- 4
- 4
- 4
- 4
- 4
- 4
- 3
- 3
- 3
- 3
- 3
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 38
- 26
- 16
- 12
- 11
- 10
- 8
- 8
- 8
- 8
- 7
- 7
- 7
- 7
- 7
- 6
- 6
- 6
- 6
- 6
- 6
- 6
- 6
- 6
- 5
- 5
- 5
- 5
- 5
- 5
- 5
- 4
- 4
- 4
- 4
- 4
- 4
- 4
- 4
- 4
- 4
- 4
- 4
- 4
- 4
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 10
- 92
- 35
- 39
- 8
- 6
- 2
- 1
- 1
- 1
- 17
- 20
- 14
- 10
- 7
- 16
- 10
- 21
- 9
- 12
- 14
- 13
- 15
- 1
- 4
- 4
- 3
- 1
- 1
- 1
- 1
- 1
- 1
- 8
- 7
- 6
- 4
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 8
- 3
- 2
|
Production automatique de gloses interlinéaires à travers un modèle probabiliste exploitant des alignements18e Conférence en Recherche d'Information et Applications -- 16e Rencontres Jeunes Chercheurs en RI -- 30e Conférence sur le Traitement Automatique des Langues Naturelles -- 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, 2023, Paris, France. pp.262-274
Communication dans un congrès
hal-04130176v1
|
|
GlotLID: Language Identification for Low-Resource LanguagesFindings of the Association for Computational Linguistics: EMNLP 2023, Association for Computational Linguistics, Dec 2023, Singapore, Singapore. pp.6155-6218
Communication dans un congrès
hal-04332442v1
|
|
BiSync: A Bilingual Editor for Synchronized Monolingual TextsThe 61st Annual Meeting of the Association for Computational Linguistics, ACL, Jul 2023, Toronto, Canada. pp.369-376
Communication dans un congrès
hal-04163029v1
|
|
Integrating Translation Memories into Non-Autoregressive Machine TranslationEACL 2023, May 2023, Dubrovnik, Croatia
Communication dans un congrès
hal-03995339v1
|
|
Towards Example-Based NMT with Multi-Levenshtein TransformersConference on Empirical Methods in Natural Language Processing, Association for Computational Linguistics, Dec 2023, Singapour, Singapore. pp.1830-1846
Communication dans un congrès
hal-04332427v1
|
|
Structural generalization in COGS: Supertagging is (almost) all you needProceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, Dec 2023, Singapour, Singapore. pp.1089-1101, ⟨10.18653/v1/2023.emnlp-main.69⟩
Communication dans un congrès
hal-04382463v1
|
|
Investigating the Translation Performance of a Large Multilingual Language Model: the Case of BLOOMEAMT 2023 - 24th Annual Conference of the European Association for Machine Translation, Jun 2023, Tampere, Finland. ⟨10.48550/ARXIV.2303.01911⟩
Communication dans un congrès
hal-04015863v2
|
|
LISN @ SIGMORPHON 2023 Shared Task on Interlinear GlossingThe 20th SIGMORPHON workshop on Computational Morphology, Phonology, and Phonetics, Association for computational linguistics, Jul 2023, Toronto, Canada. ⟨10.18653/v1/2023.sigmorphon-1.21⟩
Communication dans un congrès
hal-04186388v1
|
|
Joint Word and Morpheme Segmentation with Bayesian Non-Parametric Models17th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2023), Association for Computational Linguistics, May 2023, Dubrovnik, Croatia. pp.628-642
Communication dans un congrès
hal-04086368v1
|
|
Towards Multilingual Interlinear Morphological Glossing2023 Conference on Empirical Methods in Natural Language Processing, Association for Computational Linguistics, Dec 2023, Singapore, Singapore. pp.5958-5971, ⟨10.18653/v1/2023.findings-emnlp.396⟩
Communication dans un congrès
hal-04357157v1
|
|
MaTOS: Traduction automatique pour la science ouverte18e Conférence en Recherche d'Information et Applications -- 16e Rencontres Jeunes Chercheurs en RI -- 30e Conférence sur le Traitement Automatique des Langues Naturelles -- 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, Jun 2023, Paris, France. pp.8-15
Communication dans un congrès
hal-04131594v1
|
|
Assessing Word Importance Using Models Trained for Semantic Tasks61st Annual Meeting of the Association for Computational Linguistics (ACL 2023), ACL, Jul 2023, Toronto, Canada. pp.8846-8856
Communication dans un congrès
hal-04163044v1
|
|
Glot500: Scaling Multilingual Corpora and Language Models to 500 Languages61th Annual Meeting of the Association for Computational Linguistics, ACL, Jul 2023, Toronto, Canada
Communication dans un congrès
hal-04163023v1
|
|
Multi-Domain Adaptation in Neural Machine Translation with Dynamic Sampling StrategiesConference of the European Association for Machine Translation, European Association for Machine Translation, Jun 2022, Ghent, Belgium
Communication dans un congrès
hal-03686763v1
|
|
Weakly Supervised Word Segmentation for Computational Language DocumentationAnnual meeting of the Association for Computational Linguistics, Association for Computational Linguistics, May 2022, Dublin, Ireland
Communication dans un congrès
hal-03679416v1
|
|
Flux d'informations dans les systèmes encodeur-décodeur. Application à l'explication des biais de genre dans les systèmes de traduction automatique.Traitement Automatique des Langues Naturelles, Jun 2022, Avignon, France. pp.10-18
Communication dans un congrès
hal-03701474v1
|
European Language Equality : Ressources et technologies pour le traitement de la langue françaiseForum « Innovation, Technologies et Plurilinguisme » organisé par la Délégation Générale à la Langue Française et aux Langues de France (DGLFLF) à l’occasion de la Présidence Française de l’Union Européenne, Feb 2022, Lille, France
Communication dans un congrès
hal-04415400v1
|
|
|
Evaluating Subtitle Segmentation for End-to-end Generation Systems13th Language Resources and Evaluation Conference (LREC), ELDA, Jun 2022, Marseille, France
Communication dans un congrès
hal-03783891v1
|
|
Latent Group Dropout for Multilingual and Multidomain Machine TranslationFindings of the ACL: NAACL 2022, Association for Computational Linguistics, Jul 2022, Seattle, United States
Communication dans un congrès
hal-03720395v1
|
|
Graph-Based Multilingual Label Propagation for Low-Resource Part-of-Speech TaggingEmpirical Methods in Natural Language Processing, Association for Computational Linguistics, Dec 2022, Abu Dhabi, United Arab Emirates
Communication dans un congrès
hal-03832874v1
|
|
Ré-ordonnancement via programmation dynamique pour l'adaptation cross-lingue d'un analyseur en dépendances29ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2022), Association pour le Traitement Automatique des Langues (ATALA); Laboratoire d’Informatique et Systèmes (LIS); Laboratoire Informatique d’Avignon (LIA), Jun 2022, Avignon, France. pp.183-197
Communication dans un congrès
hal-03701508v1
|
|
Graph Neural Networks for Multiparallel Word AlignmentFindings of the ACL: ACL 2022, The Association for Computational Linguistics (ACL), May 2022, Dublin, Ireland
Communication dans un congrès
hal-03679419v1
|
|
Modèle-s bayés-ien-s pour la segment-ation à deux niveau-x faible-ment super-vis-é-eTraitement Automatique des Langues Naturelles, 2022, Avignon, France. pp.174-182
Communication dans un congrès
hal-03701487v1
|
|
Bilingual Synchronization: Restoring Translational Relationships with Editing OperationsThe 2022 Conference on Empirical Methods in Natural Language Processing (EMNLP 2022), Dec 2022, Abou Dabi, United Arab Emirates
Communication dans un congrès
hal-03827010v1
|
|
Joint Generation of Captions and Subtitles with Dual Decoding19th International Conference on Spoken Language Translation (IWSLT 2022), May 2022, Dublin, Ireland
Communication dans un congrès
hal-03666567v1
|
|
Analyzing Gender Translation Errors to Identify Information Flows between the Encoder and Decoder of a NMT SystemBlackboxNLP 2022, Dec 2022, Abu Dhabi, United Arab Emirates
Communication dans un congrès
hal-03912438v1
|
|
Vers la génération automatique de gloses pour la documentation automatique des languesJournées Jointes des Groupements de Recherche Linguistique Informatique, Formelle et de Terrain (LIFT) et Traitement Automatique des Langues (TAL), Nov 2022, Marseille, France. pp.198-203
Communication dans un congrès
hal-03846843v1
|
|
Screening Gender Transfer in Neural Machine TranslationFourth BlackboxNLP Workshop on Analyzing and Interpreting Neural Networks for NLP, Association for computational linguistics, Nov 2021, Punta Cana, Dominica
Communication dans un congrès
hal-03424174v1
|
|
Toward Genre Adapted Closed CaptioningInterspeech 2021, Aug 2021, Brno (virtual), Czech Republic. pp.4403-4407, ⟨10.21437/interspeech.2021-1762⟩
Communication dans un congrès
hal-03329488v1
|
|
Biais de genre dans un système de traduction automatique neuronale : une étude préliminaireTraitement Automatique des Langues Naturelles, 2021, Lille, France. pp.11-25
Communication dans un congrès
hal-03265895v1
|
|
Can You Traducir This? Machine Translation for Code-Switched InputWorkshop on Computational Approaches to Linguistic Code Switching, Association for Computational Linguistics, Jun 2021, Online, United States
Communication dans un congrès
hal-03218889v1
|
|
Vers la production automatique de sous-titres adaptés à l'affichageTraitement Automatique des Langues Naturelles, 2021, Lille, France. pp.91-104
Communication dans un congrès
hal-03265891v1
|
|
Optimizing Word Alignments with Better Subword TokenizationThe 18th biennial conference of the International Association of Machine Translation, Aug 2021, Miami (virtual), United States
Communication dans un congrès
hal-03322842v1
|
|
Graph Algorithms for Multiparallel Word AlignmentThe 2021 Conference on Empirical Methods in Natural Language Processing, Association for Computational Linguistics, Nov 2021, Punta Cana, Dominica
Communication dans un congrès
hal-03424044v1
|
|
One Source, Two Targets: Challenges and Rewards of Dual DecodingConference on Empirical Methods in Natural Language Processing, Nov 2021, Online and Punta Cana, Dominican Republic
Communication dans un congrès
hal-03345478v1
|
|
LISN @ WMT 20216th Conference on Statistical Machine Translation, Association for Computational Linguistics, Nov 2021, Punta Cuna, Dominica
Communication dans un congrès
hal-03430610v1
|
Unsupervised identification of motifs in turbulent channel flow using Latent Dirichlet AllocationEuromech colloquium on Machine learning methods for turbulent separated flows, Jun 2021, Paris, France
Communication dans un congrès
hal-03451341v1
|
|
|
SimAlign: High Quality Word Alignments Without Parallel Training Data Using Static and Contextualized EmbeddingsEMNLP 2020, Association for Computational Linguistics, Nov 2020, Online, United States. pp.1627 - 1643
Communication dans un congrès
hal-03013194v1
|
|
Generative latent neural models for automatic word alignmentAssociation for Machine Translation in the Americas, Oct 2020, Miami, Florida, United States. pp.64-77
Communication dans un congrès
hal-02949042v1
|
|
Simplification automatique de texte dans un contexte de faibles ressources6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 2 : Traitement Automatique des Langues Naturelles, Jun 2020, Nancy, France. pp.332-341
Communication dans un congrès
hal-02784783v3
|
|
Priming Neural Machine TranslationConference on Machine Translation, Nov 2020, Online, United States
Communication dans un congrès
hal-03013196v1
|
|
A Study of Residual Adapters for Multi-Domain Neural Machine TranslationConference on Machine Translation, Nov 2020, Online, United States
Communication dans un congrès
hal-03013197v1
|
|
The European Language Technology Landscape in 2020: Language-Centric and Human-Centric AI for Cross-Cultural Communication in Multilingual EuropeLanguage Resources and Evaluation Conference, ELDA/ELRA, May 2020, Marseille, France
Communication dans un congrès
hal-02892154v1
|
|
LIMSI @ WMT 2020Conference on Machine Translation, Nov 2020, Online, United States
Communication dans un congrès
hal-03013198v1
|
|
Controlling Utterance Length in NMT-based Word Segmentation with AttentionInternational Workshop on Spoken Language Translation, Nov 2019, Hong-Kong, China
Communication dans un congrès
hal-02343206v1
|
|
How Bad are PoS Tagger in Cross-Corpora Settings? Evaluating Annotation Divergence in the UD Project2019 Annual Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Association for Computational Linguistics, Jun 2019, Minneapolis, Minnesota, United States. pp.218 - 227
Communication dans un congrès
hal-02055137v1
|
|
Measuring text readability with machine comprehension: a pilot studyWorkshop on Building Educational Applications Using NLP, Aug 2019, Florence, Italy. pp.412 - 422
Communication dans un congrès
hal-02267546v1
|
|
Generic and Specialized Word Embeddings for Multi-Domain Machine TranslationInternational Workshop on Spoken Language Translation, Nov 2019, Hong-Kong, China. ⟨10.5281/zenodo.3524978⟩
Communication dans un congrès
hal-02343215v1
|
|
Neural Baselines for Word AlignmentsInternational Workshop on Spoken Language Translation, Nov 2019, Hong-Kong, China
Communication dans un congrès
hal-02343217v1
|
|
Fixing Translation Divergences in Parallel Corpora for Neural MTConference on Empirical Methods in Natural Language Processing, Nov 2018, Bruxelles, Belgium. pp.2967 - 2973
Communication dans un congrès
hal-01908309v1
|
|
Divergences entre annotations dans le projet Universal Dependencies et leur impact sur l'évaluation de l'étiquetage morpho-syntaxiqueConférence sur le Traitement Automatique des Langues Naturelles, May 2018, Rennes, France
Communication dans un congrès
hal-01793784v1
|
|
Bayesian models for unit discovery on a very low resource language2018 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), Apr 2018, Calgary, Alberta, Canada. ⟨10.1109/ICASSP.2018.8461545⟩
Communication dans un congrès
hal-01709589v1
|
|
Using Monolingual Data in Neural Machine Translation: a Systematic StudyConference on Machine Translation, Oct 2018, Brussels, Belgium
Communication dans un congrès
hal-01910235v1
|
|
Quantifying training challenges of dependency parsersInternational Conference on Computational Linguistics, Aug 2018, Santa Fe, New Mexico, United States. pp.3191 - 3202
Communication dans un congrès
hal-01907772v1
|
|
Unsupervised Word Segmentation: does tone matter ?International Conference on Intelligent Text Processing and Computational Linguistics, Mar 2018, Hanoï, Vietnam
Communication dans un congrès
hal-01910756v1
|
|
Automatically Selecting the Best Dependency Annotation Design with Dynamic OraclesConference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Association for Computational Linguistics, Jun 2018, New Orleans, United States. pp.401 - 406, ⟨10.18653/v1/N18-2064⟩
Communication dans un congrès
hal-01813395v1
|
|
A Very Low Resource Language Speech Corpus for Computational Language Documentation ExperimentsLanguage Resources and Evaluation Conference (LREC), Nicoletta Calzolari (Conference chair) and Khalid Choukri and Christopher Cieri and Thierry Declerck and Sara Goggi and Koiti Hasida and Hitoshi Isahara and Bente Maegaard and Joseph Mariani and Hélène Mazo and Asuncion Moreno and Jan Odijk and Stelios Pi, May 2018, Miyazaki, Japan
Communication dans un congrès
hal-01807093v1
|
Computational language documentation: some results from the BULB projectCollaboration and Computing for Under-Resourced Languages, May 2018, Miyazaki, Japan
Communication dans un congrès
hal-02387379v1
|
|
|
Exploiting Dynamic Oracles to Train Projective Dependency Parsers on Non-Projective TreesConference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, ACL, Jun 2018, New Orleans, United States. pp.413 - 419
Communication dans un congrès
hal-01813394v1
|
|
Morphological Evaluation for Machine Translation : Adaptation to FrenchConférence sur le Traitement Automatique des Langues Naturelles, May 2018, Rennes, France
Communication dans un congrès
hal-01793785v1
|
|
Unsupervised Word Segmentation from Speech with AttentionInterspeech 2018, Sep 2018, Hyderabad, India
Communication dans un congrès
hal-01818092v1
|
|
The WMT'18 Morpheval test suites for English-Czech, English-German, English-Finnish and Turkish-English3rd Conference on Machine Translation (WMT 18), Oct 2018, Bruxelles, Belgium. pp.550-564, ⟨10.18653/v1/W18-64060⟩
Communication dans un congrès
hal-01910244v1
|
|
Adaptor Grammars for the Linguist: Word Segmentation Experiments for Very Low-Resource LanguagesWorkshop on Computational Research in Phonetics, Phonology, and Morphology, Oct 2018, Bruxelles, Belgium. pp.32 - 42, ⟨10.18653/v1/P17⟩
Communication dans un congrès
hal-01910757v1
|
|
Don't Stop Me Now! Using Global Dynamic Oracles to Correct Training Biases of Transition-Based Dependency ParsersConference of the European Chapter of the ACL, Jan 2017, Valencia, Spain. pp.318 - 323, ⟨10.18653/v1/E17-2051⟩
Communication dans un congrès
hal-01618377v1
|
|
Learning the Structure of Variable-Order CRFs: a finite-state perspectiveConference on Empirical Methods in Natural Language Processing, Sep 2017, Copenhagen, Denmark. pp.433 - 439, ⟨10.18653/v1/D17-1044⟩
Communication dans un congrès
hal-01710793v1
|
|
Word Representations in Factored Neural Machine TranslationConference on Machine Translation, Association for Computational Linguistics, Sep 2017, Copenhagen, Denmark. pp.43 - 55
Communication dans un congrès
hal-01618384v1
|
|
Adaptation au domaine pour l'analyse morpho-syntaxiqueConférence sur le Traitement Automatique des Langues Naturelles, Jun 2017, Orléans, France
Communication dans un congrès
hal-01620900v1
|
|
Learning Morphological Normalization for Translation from Morphologically Rich LanguagesConférence sur le Traitement Automatique des Langues Naturelles, Jun 2017, Orléans, France
Communication dans un congrès
hal-01620901v1
|
|
LIMSI@WMT'17Conference on Machine Translation, Association for Computational Linguistics, Jan 2017, Copenhagen, Denmark. pp.257 - 264
Communication dans un congrès
hal-01619897v1
|
|
Evaluating the morphological competence of Machine Translation Systems2nd Conference on Machine Translation (WMT17), Association for Computational Linguistics, Sep 2017, Copenhague, Denmark. pp.43-55
Communication dans un congrès
hal-01618387v1
|
|
Cross-lingual alignment transfer: a chicken-and-egg story?Workshop on Multilingual and Cross-lingual Methods in NLP , Jun 2016, San Diego, CA, United States. pp.35-44, ⟨10.18653/v1/W16-1205⟩
Communication dans un congrès
hal-01622815v1
|
Breaking the unwritten language barrier: the BULB projectSLTU-2016 5th Workshop on Spoken Language Technologies for Under-resourced languages, May 2016, Yogyakarta, Indonesia. ⟨10.1016/j.procs.2016.04.023⟩
Communication dans un congrès
halshs-01428027v1
|
|
|
Parallel Sentence CompressionCOLING 2016, the 26th International Conference on Computational Linguistics, 2016, Osaka, Japan. pp.1503--1513
Communication dans un congrès
hal-01592334v1
|
|
Two-Step MT: Predicting Target MorphologyInternational Workshop on Spoken Language Translation, 2016, Seattle, WA, United States
Communication dans un congrès
hal-01592337v1
|
|
Diagnosing High-Quality Statistical Machine Translation Using Traces of Post-Edition OperationsInternational Conference on Language Resources and Evaluation - Workshop on Translation Evaluation: From Fragmented Tools and Data Sets to an Integrated Ecosystem (MT Eval 2016 2016), 2016, Portorož, Slovenia. pp.8
Communication dans un congrès
hal-01388655v1
|
|
LIMSI@WMT16: Machine Translation of NewsFirst Conference on Machine Translation, Aug 2016, Berlin, Germany. pp.239--245, ⟨10.18653/v1/W16-2304⟩
Communication dans un congrès
hal-01388659v1
|
|
A 2D CRF Model for Sentence Alignment9th Workshop on Building and Using Comparable Corpora, 2016, Portorož, Slovenia
Communication dans un congrès
hal-01388656v1
|
|
LIMSI@IWSLT'16: MT TrackInternational Workshop on Spoken Language Translation, Dec 2016, Seattle, WA, United States
Communication dans un congrès
hal-01592336v1
|
|
The QT21/HimL Combined Machine Translation SystemFirst Conference on Machine Translation (WMT16), Aug 2016, Berlin, Germany. pp.344-355, ⟨10.18653/v1/W16-2320⟩
Communication dans un congrès
hal-01388657v1
|
|
Cross-lingual Dependency Transfer : What Matters? Assessing the Impact of Pre- and Post-processingWorkshop on Multilingual and Cross-lingual Methods in NLP, Jun 2016, San Diego, United States. pp.20 - 29, ⟨10.18653/v1/W16-1203⟩
Communication dans un congrès
hal-01961510v1
|
|
LIMSI's Contribution to the WMT'16 Biomedical Translation TaskFirst Conference on Machine Translation, Aug 2016, Berlin, Germany. pp.469-476, ⟨10.18653/v1/W16-2337⟩
Communication dans un congrès
hal-01388658v1
|
|
Novel elicitation and annotation schemes for sentential and sub-sentential alignments of bitextsLanguage Resources and Evaluation Conference (LREC'16), ELRA, May 2016, Portoroz, Slovenia
Communication dans un congrès
hal-03396226v1
|
|
TransRead: Designing a Bilingual Reading Experience with Machine Translation TechnologiesNAACL, North American Chapter of the Association for Computational Linguistics, Jun 2016, San Diego, United States. pp.5, ⟨10.18653/v1/N16-3006⟩
Communication dans un congrès
hal-01370497v1
|
|
Unsupervised learning of morphology in the USSRJournées internationales d'Analyse statistique des Données Textuelles, Damon Mayaffre, Céline Poudat, Laurent Vanni, Véronique Magri, Peter Follette, Jun 2016, Nice, France
Communication dans un congrès
hal-01620908v1
|
|
Innovative technologies for under-resourced language documentation: The BULB ProjectWorkshop CCURL 2016 - Collaboration and Computing for Under-Resourced Languages - LREC, May 2016, Portoroz, Slovenia
Communication dans un congrès
hal-01350124v1
|
|
Zero-resource Dependency Parsing: Boosting Delexicalized Cross-lingual Transfer with Linguistic KnowledgeCOLING 2016, the 26th International Conference on Computational Linguistics, 2016, Osaka, Japan. pp.119--130
Communication dans un congrès
hal-01592335v1
|
|
Preliminary Experiments on Unsupervised Word Discovery in MboshiInterspeech 2016, Sep 2016, San-Francisco, United States
Communication dans un congrès
hal-01350119v1
|
|
Apprentissage discriminant des modèles continus de traductionConférence sur le Traitement Automatique des Langues Naturelles, 2015, Caen, France
Communication dans un congrès
hal-01634998v1
|
|
Why Predicting Post-Edition is so Hard? Failure Analysis of LIMSI Submission to the APE Shared TaskTenth Workshop on Statistical Machine Translation, Association for Computational Linguistics, Sep 2015, Lisbon, Portugal. pp.222 - 227
Communication dans un congrès
hal-01635022v1
|
|
Oublier ce qu'on sait, pour mieux apprendre ce qu'on ne sait pas : une étude sur les contraintes de type dans les modèles CRFConférence sur le Traitement Automatique des Langues Naturelles, ATALA, 2015, Caen, France
Communication dans un congrès
hal-01634997v1
|
|
Apprentissage par imitation pour l'étiquetage de séquences : vers une formalisation des méthodes d'étiquetage « easy-first »22ièmeTraitement Automatique des Langues Naturelles, Caen, 2015, Jan 2015, Caen, France
Communication dans un congrès
hal-01634999v1
|
Morphology-Aware Alignments for Translation to and from a Synthetic LanguageInternational Workshop on Spoken Language Translation, Jan 2015, Da Nang, Vietnam
Communication dans un congrès
hal-01635005v1
|
|
|
A Discriminative Training Procedure for Continuous Translation ModelsConference on Empirical Methods in Natural Language Processing, The Association for Computational Linguistics, Sep 2015, Lisbon, Portugal. pp.1046 - 1052
Communication dans un congrès
hal-01635000v1
|
|
Structured Prediction for Speaker Identification in TV SeriesAnnual Conference of the International Speech Communication Association, Jan 2015, Dresden, Germany
Communication dans un congrès
hal-01635001v1
|
|
Construction (très) rapide de tables de traduction à partir de grands bi-textesConférence sur le Traitement Automatique des Langues Naturelles, Jan 2014, Marseille, France
Communication dans un congrès
hal-01908369v1
|
|
Adaptation thématique pour la traduction automatique de dépêches de presseConférence sur le Traitement Automatique des Langues Naturelles, Jan 2014, Marseille, France
Communication dans un congrès
hal-01908348v1
|
Rule-based reordering spaces in statistical machine translationInternational Conference on Language Resources and Evaluation, Jan 2014, Reykjavik, Iceland
Communication dans un congrès
hal-01908354v1
|
|
Traduction de la parole dans le projet RAPMATJournées d'Études sur la Parole, Jan 2014, Le Mans, France
Communication dans un congrès
hal-01843418v1
|
|
|
Cross-Lingual Part-of-Speech Tagging through Ambiguous LearningConference on Empirical Methods in Natural Language Processing, Oct 2014, Doha, Qatar. pp.1779 - 1785
Communication dans un congrès
hal-01908356v1
|
Traduction de la parole dans le projet RAPMATJEP 2014, Jun 2014, Le Mans, France
Communication dans un congrès
hal-01744256v1
|
|
|
Vers un développement plus efficace des systèmes de traduction statistique : un peu de vert dans un monde de BLEUConférence sur le Traitement Automatique des Langues Naturelles, Jan 2014, Marseille, France
Communication dans un congrès
hal-01908367v1
|
Combining techniques from different NN-based language models for machine translationConference of the Association for Machine Translation in the Americas, Yaser Al-Onaizan and Michel Simard, Jan 2014, Vancouver, Canada
Communication dans un congrès
hal-01908370v1
|
|
Apprentissage partiellement supervisé d'un étiqueteur morpho-syntaxique par transfert cross-lingueConférence sur le Traitement Automatique des Langues Naturelles, Jan 2014, Marseille, France
Communication dans un congrès
hal-01908360v1
|
|
Modèles de langue neuronaux: une comparaison de plusieurs stratégies d'apprentissageConférence sur le Traitement Automatique des Langues Naturelles, Jan 2014, Marseille, France
Communication dans un congrès
hal-01908361v1
|
|
|
Design and Analysis of a Large Corpus of Post-Edited Translations: Quality Estimation, Failure Analysis and the Variability of Post-EditionMachine Translation Summit XIV, Sep 2013, Nice, France
Communication dans un congrès
hal-03748614v1
|
Human Errors and Automatic Errors in Machine Translations. What are the Differences?Errare workshop : Erreurs humaines et des machines dans le traitement de données multimédias, multimodales et multilingues, Nov 2013, Ermenonville, France
Communication dans un congrès
hal-01217552v1
|
|
|
La tâche de prédiction de la qualité. Session 5 - Mesure de la qualité en TATralogy II. Trouver le sens : où sont nos manques et nos besoins respectifs ?, Jan 2013, Paris, France. 16p
Communication dans un congrès
hal-02497522v1
|
Fast large-margin learning for statistical machine translationInternational Conference on Intelligent Text Processing and Computational Linguistics, Jan 2013, Samos, Greece
Communication dans un congrès
hal-01908382v1
|
|
|
Discriminative training of a phoneme confusion model for a dynamic lexicon in ASRAnnual Conference of the International Speech Communication Association, Jan 2013, Lyon, France
Communication dans un congrès
hal-01843427v1
|
|
Un corpus d'erreurs de traduction20e conférence sur le Traitement Automatique des Langues Naturelles (TALN'2013), Jun 2013, Les Sables d'Olonne, France. pp.723-730
Communication dans un congrès
hal-01908384v1
|
|
A fully discriminative training framework for Statistical Machine Translation20ème Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2013, Batz-les-Bains, France
Communication dans un congrès
hal-01908381v1
|
|
LIMSI @ WMT'13Workshop on Statistical Machine Translation 2013 (WMT 13), Aug 2013, Sofia, Bulgaria. pp.62 - 69
Communication dans un congrès
hal-01489998v1
|
|
Structure learning in hidden conditional random fields for grapheme-to-phoneme conversionAnnual Conference of the International Speech Communication Association, Aug 2013, Lyon, France
Communication dans un congrès
hal-01908385v1
|
Non-linear n-best list reranking with few featuresConference of the Association for Machine Translation in the Americas, Jan 2012, San Diego, United States
Communication dans un congrès
hal-01960657v1
|
|
|
Hierarchical Sub-sentential Alignment with Anymalign16th annual conference of the European Association for Machine Translation (EAMT 2012), May 2012, Trento, Italy. pp.279-286
Communication dans un congrès
hal-00747385v1
|
Joint Segmentation and POS Tagging for Arabic Using a CRF-based ClassifierInternational Conference on Language Resources and Evaluation, Jan 2012, Istanbul, Turkey
Communication dans un congrès
hal-01960652v1
|
|
Repérage des entités nommées pour l'arabe : adaptation non-supervisée et combinaison de systèmesConférence sur le Traitement Automatique des Langues Naturelles, Jan 2012, Grenoble, France
Communication dans un congrès
hal-01960655v1
|
|
Towards contextual adaptation for any-text translationInternational Workshop on Spoken Language Translation, Jan 2012, Hong Kong, China
Communication dans un congrès
hal-01960670v1
|
|
|
Aligning Bilingual Literary Works: a Pilot StudyNAACL-HLT 2012 Workshop on Computational Linguistics for Literature, ACL, Jun 2012, Montréal, Canada. pp.36--44
Communication dans un congrès
hal-00709319v1
|
Alignement sous-phrastique hiérarchique avec AnymalignConférence sur le Traitement Automatique des Langues Naturelles, Jan 2012, Grenoble, France
Communication dans un congrès
hal-01960673v1
|
|
|
Alignement sous-phrastique hiérarchique avec Anymalign19e conférence sur le Traitement Automatique des Langues Naturelles (TALN 2012), Jun 2012, Grenoble, France. pp.113-126
Communication dans un congrès
hal-00747398v1
|
|
Continuous space translation models with neural networksConference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Jun 2012, Montréal, Canada
Communication dans un congrès
hal-01960659v1
|
Revisiting sentence alignment algorithms for alignment visualization and evaluationWorkshop on Building and Using Comparable Corpora, ELRA, May 2012, Istanbul, Turkey
Communication dans un congrès
hal-01960678v1
|
|
|
Computing lattice BLEU Oracle scores for machine translation13th Conference of the European Chapter of the Association for computational Linguistics, Association for Computational Linguistics, Apr 2012, Avignon, France. pp.120 - 129
Communication dans un congrès
hal-01960649v1
|
|
Généralisation de l'alignement sous-phrastique par échantillonnageTALN & RECITAL 2011 : 18ème conférence sur le Traitement Automatique des Langues Naturelles, Jun 2011, Montpellier, France
Communication dans un congrès
hal-01960715v1
|
Minimum error rate semi-ringAnnual Conference of the European Association for Machine Translation, Jan 2011, Leuven, Belgium
Communication dans un congrès
hal-01960720v1
|
|
Discriminative weighted alignment matrices for statistical machine translationAnnual Conference of the European Association for Machine Translation, Jan 2011, Leuven, Belgium
Communication dans un congrès
hal-01960723v1
|
|
Large vocabulary SOUL neural network language modelsAnnual Conference of the International Speech Communication Association, Jan 2011, Florence, Italy
Communication dans un congrès
hal-01960743v1
|
|
|
Two ways to use a noisy parallel news corpus for improving statistical machine translationWorkshop on Building and Using Comparable Corpora, Jun 2011, Portland, United States
Communication dans un congrès
hal-01960725v1
|
Designing an improved discriminative word alignerInternational Conference on Intelligent Text Processing and Computational Linguistics, Jan 2011, Tokyo, Japan
Communication dans un congrès
hal-01960730v1
|
|
Two ways to use a noisy parallel news corpus for improving statistical machine translationWorkshop on Building and Using Comparable Corpora, Jun 2011, Portland, United States
Communication dans un congrès
hal-01960724v1
|
|
Measuring the Confusability of Pronunciations in Speech RecognitionInternational Workshop on Finite State Methods and Natural Language Processing, Jan 2011, Tours, France
Communication dans un congrès
hal-01960733v1
|
|
|
Généralisation de l'alignement sous-phrastique par échantillonnage18e conférence sur le Traitement Automatique des Langues Naturelles (TALN 2011), Jun 2011, Montpellier, France. pp.507-518
Communication dans un congrès
hal-00606400v1
|
|
LIMSI @ WMT11Sixth Workshop on Statistical Machine Translation (WMT 11), Jul 2011, Edinburgh, United Kingdom. pp.309-315
Communication dans un congrès
hal-00644047v1
|
Quelques préalables au calcul de la productivité des règles constructionnelles et premiers résultatsPremier Congrès Mondial de Linguistique Française, Jul 2008, Paris, France. pp.1525-1538, ⟨10.1051/cmlf08184⟩
Communication dans un congrès
hal-00522821v1
|
|
|
Semi-automatic labeling of coreferent named entities: an experimental studyLREC 2008 workshop W15: 'Resources and Evaluation for Identity Matching, Entity Resolution and Entity Management', 2008, Marrakech, Morocco. pp.1-7
Communication dans un congrès
hal-00487082v1
|
|
Robust similarity measures for named entities matchingCOLING 2008, Aug 2008, Manchester, United Kingdom. pp.593-600
Communication dans un congrès
hal-00487084v1
|
|
Appariement d'entités nommées coréférentes : combinaisons de mesures de similarité par apprentissage superviséTALN 2008, Jun 2008, Avignon, France. pp.Online Proceedings
Communication dans un congrès
hal-00487081v1
|
|
Engineering Multimedia Applications on the basis of Multi-Structured Descriptions of Audiovisual ContentsProceedings of the 2007 international workshop on Semantically aware document processing and indexing, May 2007, Montpellier, France
Communication dans un congrès
inria-00189340v1
|
Quelques préalables linguistiques au calcul de la productivité des règles constructionnelles et premiers résultats.Journée ATALA "La productivité morphologique", Oct 2007, Paris, France
Communication dans un congrès
hal-00526347v1
|
|
Productivité quantitative des suffixations par –ité et par -Able dans un corpus journalistique moderne.2006, p. 167-177
Communication dans un congrès
halshs-00128305v1
|
|
Productivité quantitative de la suffixation par -Able dans un corpus journalistique du français.JADT 2006, 2006, Besançon, France. pp. 473-485
Communication dans un congrès
hal-00522827v1
|
|
Productivité quantitative des suffixations par -ité et -Able dans un corpus journalistique moderneTALN 2006, 2006, Louvain, Belgique. pp. 167-175
Communication dans un congrès
hal-00522825v1
|
|
|
Contribution de la métrique à la stylométrieActes des 7èmes Journées Internationales d'Analyse Statistique des données textuelles (JADT), Mar 2004, Louvain la Neuve, Belgique. pp.107-118
Communication dans un congrès
hal-00741596v1
|
Proper Names Extraction from Fax Images Combining Textual and Image FeaturesICDAR 2003 : Seventh International Conference on Document Analysis and Recognition, Aug 2003, Edinburgh, United Kingdom. ISBN 0-7695-1960-1, p. 545-549, ⟨10.1109/ICDAR.2003.1227724⟩
Communication dans un congrès
hal-00328998v1
|
|
Sirocco : un système ouvert de reconnaissance de la paroleActes JEP'2002, 2002, Nancy, Unknown Region
Communication dans un congrès
hal-01434573v1
|
|
Integrating Contextual Phonological Rules in a Large Vocabulary DecoderActes EUROSPEECH'2001, 2001, Aalborg, Denmark
Communication dans un congrès
hal-01457130v1
|
|
Screening Gender Transfer in Neural Machine TranslationBlackBoxNLP 2021, Nov 2021, Punta Cana, Dominican Republic
Poster de conférence
hal-03993451v1
|
Textual Information Access: Statistical ModelsJohn Wiley & Sons, pp.448, 2012, 978-1-84821-322-7
Ouvrages
hal-00741271v1
|
|
Modèles statistiques pour l'accès à l'information textuelleHERMÈS / LAVOISIER, pp.482, 2011, ISBN 10 : 2746224976; ISBN 13 : 9782746224971
Ouvrages
hal-00742830v1
|
|
Transformers in Natural Language ProcessingMohamed Chetouani; Virginia Dignum; Paul Lukowicz; Carles Sierra. Human-Centered Artificial Intelligence. Advanced Lectures, 13500, Springer International Publishing, pp.81-105, 2023, Lecture Notes in Computer Science, 978-3-031-24348-6. ⟨10.1007/978-3-031-24349-3_6⟩
Chapitre d'ouvrage
hal-04224531v1
|
|
Language Report FrenchGeorg Rehm; Andy Way. European Language Equality. A Strategic Agenda for Digital Language Equality, Springer International Publishing, pp.139-142, 2023, Cognitive Technologies, 978-3-031-28818-0. ⟨10.1007/978-3-031-28819-7_16⟩
Chapitre d'ouvrage
hal-04121465v1
|
|
For a common European framework for evaluating AI- based translation technologiesRachele Raus. How artificial intelligence can further European multilingualism Strategic recommendations for European decision-makers, Università di Torino - Artificial Intelligence for European Integration; Ledizioni, pp.93-96, 2023, 9791256000142
Chapitre d'ouvrage
hal-04392444v1
|
Les adjectifs en inXable du françaisF. Florilic éd. La négation dans les langues romanes, John Benjamins, coll. « Investigationes Supplementa », pp.215-234, 2007
Chapitre d'ouvrage
hal-01279642v1
|
|
Segmentation en mots faiblement supervisée pour la documentation automatique des langues2021
Autre publication scientifique
hal-03477475v1
|
Traduire comme on joue au go ?2016
Autre publication scientifique
hal-01592333v1
|
|
European Language Equality - Report on the French Language[Research Report] CNRS - LISN. 2022
Rapport
hal-03637776v1
|
|
État de l'art des technologies linguistiques pour la langue française[Rapport de recherche] CNRS - LISN. 2022
Rapport
hal-03637784v1
|
|
Utilisation de ressources lexicales et terminologiques en traduction neuronale[Rapport de recherche] 2020-001, LIMSI-CNRS. 2020, 56 p
Rapport
hal-02895535v4
|
|
Rapport du groupe de travail "Traductions et science ouverte"[Rapport Technique] Comité pour la science ouverte. 2020, 44 p
Rapport
hal-03640511v1
|
|
Document level contexts for neural machine translation[Research Report] 2020-003, LIMSI-CNRS. 2020, 72 p
Rapport
hal-03687190v2
|
A multilingual corpus of tweets for domain adaptation[Research Report] LIMSI-CNRS; ELDA; Systran. 2017
Rapport
hal-01529857v1
|
|
A Corpus of Machine Translation Errors Extracted from Translation Students ExercisesNicoletta Calzolari, Khalid Choukri, Thierry Declerck, Hrafn Loftsson, Bente Maegaard, Joseph Mariani, Asuncion Moreno, Jan Odijk, Stelios Piperidis. LREC 2014, May 2014, Reykjavik, Iceland. , pp.3585-3588, 2014, Proceedings of the Ninth Language Resources and Evaluation Conference (LREC 2014), 26-31 May, Reykjavik, Iceland
Proceedings/Recueil des communications
hal-01134899v1
|