Accéder directement au contenu

Didier Schwab

Professeur des universités (CNU 27)
94%
Libre accès
49
Documents
Affiliations actuelles
Identifiants chercheurs
Contact

Présentation

### En bref : - Enseignant-chercheur en informatique (CNU 27), Professeur des universités - Membre de l'équipe [GETALP](https://lig-getalp.imag.fr/fr/accueil/) au [Laboratoire Informatique de Grenoble](https://www.liglab.fr) (LIG, UMR 5217), depuis 2007 - Recherches : Grands modèles de langue, représentation, l’acquisition et l’exploitation de connaissances pour et par les textes ; Dialogue assisté par la machine pour les personnes en situation de handicap - Responsabilités actuelles : - 2023 - 2024 : Membre élu du Conseil d'Administration de l'Université Grenoble Alpes - 2022 - : Co-animateur avec Corinne Fredouille (U. d'Avignon, LIA) de l'axe [Cognition et Langage](https://www.institut-cognition.com/innovez-par-la-cognition/cognition-et-langage/) de l'[Institut Carnot Cognition](https://www.institut-cognition.com) - 2020 - : Chargé de mission valorisation au LIG - 2020 - : Membre du comité de rédaction de la [revue TAL (Traitement Automatique des Langues)](https://www.atala.org/revuetal) - 2019 - : Membre du Comité Permanent de la conférence TALN ([https://www.atala.org/comitepermanent](https://www.atala.org/comitepermanent "Traitement Automatique des Langues Naturelles")) - 2012 - 2024 : Membre du conseil d'administration de l'ATALA ([Association pour le Traitement Automatique des Langues](https://www.atala.org/association "Association pour le Traitement Automatique des Langues")) Google Scholar : [https://scholar.google.com/citations?hl=fr&user=eKDJXyUAAAAJ ](https://scholar.google.com/citations?hl=fr&user=eKDJXyUAAAAJ) ### Quelques projets - Pantagruel (2023 -- 2026) : Construction et évaluation de grands modèles de langue multimodaux et inclusifs -- écrit, oral, pictogrammes -- pour le français général et clinique -- financement principal : ANR (600 K) -- rôle : coordinateur du projet - AAC4All (2022 -- 2025) : Communication augmentée et alternative pour tous -- https://www.aac4all.org -- financement principal : ANR (700 k https://anr.fr/Projet-ANR-21-CE19-0051) -- rôle : coordinateur de site ### Encadrement de doctorant(e)s : - Lucía Ormaechea Grijalba (2022-) avec Pierrette Bouilllon (Université de Genève, Faculté de traduction et d'interprétation) et Benjamin Lecouteux (UGA, LIG, GETALP) : *Simplification de la parole pour la traduction vers des pictogrammes* - Fabien Lopez (2022-) *avec Marco Dinarelli (CNRS, LIG, GETALP) et Emmanuelle Esperança-Rodier (UGA, LIG, GETALP) : La résolution de coréférences et son application à la traduction automatique* - Aidan Mannion (2021-) avec Lorraine Gœuriot (UGA, LIG, GETALP) : *Modéles de langue contextualisés pour la trajectoire patients* - Cécile Macaire (2021-) avec Benjamin Lecouteux (UGA, LIG, GETALP) et Emmanuelle Esperança-Rodier (UGA, LIG, GETALP) : *Génération de pictogramme à partir de la parole pour la mise en place d’une communication médiée par la machine* - Jeongwoo KANG (2021-) avec Maximin Coavoux (CNRS, LIG, GETALP) : *Apprentissage par transfert pour l’analyse sémantique* - Xingyu LIU (2021-) avec François Portet (UGA, LIG, GETALP) : Système dialogique de questions-réponses contrôlé : application aux forums sur la santé des femmes ### Thèses soutenues : 8 LE Hang (Thèse soutenue le 25 mars 2024) avec Benjamin Lecouteux (UGA, LIG, GETALP) : *Model Architectures and Training Techniques for Multilingual Speech-to-Text Translation* 7 Emmanuelle Kelodjoue (Soutenue le 5 octobre 2022) avec Jérôme Goulian (UGA, LIG, GETALP) : *Extraction d’opinions pour l’aide à l’analyse multicritère de corpus oraux transcrits* 6 Jibril Frej (Thèse soutenue le 5 février 2021) avec Jean-Pierre Chevallet (UGA, LIG, MRIM) : *Connaissances a priori pour la Recherche d'Information textuelle basée sur l'apprentissage profond* 5 Loïc Vial (Thèse soutenue le 20 juillet 2020) avec Benjamin Lecouteux (UGA, LIG, GETALP) : *Modèles joints de clarification de texte et de traduction automatique statistique* 4 El Moatez Billah Nagoudi (Thèse soutenue en mars 2019) avec Ahmed Khorsi (Al-Imam Mohammad Ibn Saud Islamic University, Saudi Arabia) et Hadda Cherroun (Laboratoire d’Informatique et de Mathématique LIM, Amar Telidji University, Laghouat, Algeria) : *Détection de plagiat en langue arabe*. 3 Marwa Hadj-Salah (Thèse soutenue en décembre 2018) avec Hervé Blanchon (UGA, LIG, GETALP) et Mounir Zrigui (Université de Monastir, Tunisie) : *Désambiguïsation lexicale de l'arabe pour et par la traduction automatique.* 2 Jérémy Ferrero ([Thèse soutenue en décembre 2017](https://tel.archives-ouvertes.fr/tel-01721390)) avec Laurent Besacier (UGA, LIG, GETALP) et Frédéric Agnès (Société Compilatio) : *Similarités Textuelles Sémantiques Translingues : vers la Détection Automatique du Plagiat par Traduction*. 1 Andon Tchechmedjiev ([Thèse soutenue en octobre 2016](https://tel.archives-ouvertes.fr/tel-01425123/)) avec Gilles Sérasset (UGA, LIG, GETALP) et Jérôme Goulian (UGA, LIG, GETALP) : *Interopérabilité Sémantique Multilingue des Ressources Lexicales en Données Liées Ouvertes.* ### Parcours Depuis le 1er septembre 2022 : Professeur des universités à l’Université Grenoble Alpes– IUT2 département Techniques de Commercialisation, Laboratoire d’Informatique de Grenoble - Groupe d'Étude en Traduction Automatique et Traitement Automatisé des Langues et de la Parole sept. 2008 - Août 2022 : Maître de conférences à l’Université Grenoble Alpes– IUT2 département Techniques de Commercialisation, Laboratoire d’Informatique de Grenoble - Groupe d'Étude en Traduction Automatique et Traitement Automatisé des Langues et de la Parole Sept. 2007 – Août 2008 : Attaché Temporaire d’Enseignement et de Recherche à l’Université Grenoble II – IUT2 département Informatique, Laboratoire d’Informatique de Grenoble - Groupe d'Étude en Traduction Automatique et Traitement Automatisé des Langues et de la Parole Avril 2006 – Août 2007 : Chargé de recherche, post-doctorat, Unité de Traduction Assistée par Ordinateur (UTMK), Universiti Sains Malaysia, Penang, Malaisie 2001-2005 : Thèse de doctorat, monitorat et Attaché Temporaire d’Enseignement et de Recherche à l’Université Montpellier 2

Publications

benjamin-lecouteux
Image document

Jargon: A Suite of Language Models and Evaluation Tasks for French Specialized Domains

Vincent Segonne , Aidan Mannion , Laura Cristina Alonzo Canul , Alexandre Audibert , Xingyu Liu
LREC-COLING 2024 - Joint International Conference on Computational Linguistics, Language Resources and Evaluation, May 2024, Turin, Italy
Communication dans un congrès hal-04535557v1
Image document

Vers une simplification automatique de la parole en français

Lucía Ormaechea , Pierrette Bouillon , Benjamin Lecouteux , Didier Schwab
Colloque International AFLS 2023 – Le français et ses frontières, Université de Lille, Sep 2023, Villeneuve-d'Ascq, France
Communication dans un congrès hal-04283197v1
Image document

Plateformes pour la création de données en pictogrammes

Cécile Macaire , Jordan Arrigo , Chloé Dion , Claire Lemaire , Emmanuelle Esperança-Rodier
18e Conférence en Recherche d'Information et Applications, 16e Rencontres Jeunes Chercheurs en RI, 30e Conférence sur le Traitement Automatique des Langues Naturelles, 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, 2023, Paris, France. pp.6-9
Communication dans un congrès hal-04208581v1
Image document

PROPICTO: Developing Speech‑to‑Pictograph Translation Systems to Enhance Communication Accessibility

Lucía Ormaechea , Pierrette Bouillon , Maximin Coavoux , Emmanuelle Esperança-Rodier , Johanna Gerlach
24th Annual Conference of The European Association for Machine Translation (EAMT), European Association for Machine Translation; Tampere University; University of Eastern Finland, Jun 2023, Tampere, Finland. pp.515-516
Communication dans un congrès hal-04283267v1
Image document

Voice2Picto : un système de traduction automatique de la parole vers des pictogrammes

Cécile Macaire , Emmanuelle Esperança-Rodier , Benjamin Lecouteux , Didier Schwab
18e Conférence en Recherche d'Information et Applications, 16e Rencontres Jeunes Chercheurs en RI, 30e Conférence sur le Traitement Automatique des Langues Naturelles, 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, 2023, Paris, France. pp.10-13
Communication dans un congrès hal-04208583v1

Simple, Simpler and Beyond: A Fine-Tuning BERT-Based Approach to Enhance Sentence Complexity Assessment for Text Simplification

Lucía Ormaechea , Nikos Tsourakis , Didier Schwab , Pierrette Bouillon , Benjamin Lecouteux
ICNLSP (International Conference on Natural Language and Speech Processing), University of Trento, Dec 2023, Trento, Italy
Communication dans un congrès hal-04439105v1
Image document

PROPICTO: Developing Speech-to-Pictograph Translation Systems to Enhance Communication Accessibility

Lucía Ormaechea , Pierrette Bouillon , Maximin Coavoux , Johanna Gerlach , Jérôme Goulian
European Association for Machine Translation, Jun 2023, Tampere, Finland
Communication dans un congrès hal-04241457v1
Image document

PROPICTO : Développer des systèmes de traduction de la parole vers des séquences de pictogrammes pour améliorer l'accessibilité de la communication

Lucia Ormaechea-Grijalba , Pierrette Bouillon , Maximin Coavoux , Emmanuelle Esperança-Rodier , Johanna Gerlach
18e Conférence en Recherche d'Information et Applications, 16e Rencontres Jeunes Chercheurs en RI, 30e Conférence sur le Traitement Automatique des Langues Naturelles, 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, 2023, Paris, France. pp.32-35
Communication dans un congrès hal-04208597v1
Image document

Pre-training for Speech Translation: CTC Meets Optimal Transport

Phuong-Hang Le , Hongyu Gong , Changhan Wang , Juan Pino , Benjamin Lecouteux
International Conference on Machine Learning (ICML), 2023, Jul 2023, Honolulu, Hawaii, United States
Communication dans un congrès hal-04117237v1
Image document

Simple, Simpler and Beyond: A Fine-Tuning BERT-Based Approach to Enhance Sentence Complexity Assessment for Text Simplification

Lucía Ormaechea , Nikos Tsourakis , Didier Schwab , Pierrette Bouillon , Benjamin Lecouteux
ICNLSP (International Conference on Natural Language and Speech Processing), University of Trento, Dec 2023, Trento, Italy
Communication dans un congrès hal-04359942v1
Image document

LeBenchmark, un référentiel d'évaluation pour le français oral *

Hang Le , Sina Alisamir , Marco Dinarelli , Fabien Ringeval , Solène Evain
34e Journées d'étude sur la parole JEP 2022, Jun 2022, île de Noirmoutier, France
Communication dans un congrès hal-03767742v1
Image document

A Tool for Easily Integrating Grammars as Language Models into the Kaldi Speech Recognition Toolkit

Lucía Ormaechea , Benjamin Lecouteux , Pierrette Bouillon , Didier Schwab
European Summer School in Logic, Language and Information (ESSLI), Aug 2022, Galway, Ireland
Communication dans un congrès hal-03722458v1
Image document

Modèles neuronaux pré-appris par auto-supervision sur des enregistrements de parole en français

Solène Evain , Ha Nguyen , Hang Le , Marcely Zanon Boito , Salima Mdhaffar
JEP 2022, Jun 2022, île de Noirmoutier, France
Communication dans un congrès hal-03707064v1
Image document

Automatic Speech Recognition and Query By Example for Creole Languages Documentation

Cécile Macaire , Didier Schwab , Benjamin Lecouteux , Emmanuel Schang
Findings of the Association for Computational Linguistics: ACL 2022, May 2022, Dublin, Ireland
Communication dans un congrès hal-03625303v1
Image document

ON-TRAC' systems for the IWSLT 2021 low-resource speech translation and multilingual speech translation shared tasks

Hang Le , Florentin Barbier , Ha Nguyen , Natalia Tomashenko , Salima Mdhaffar
International Conference on Spoken Language Translation (IWSLT), Aug 2021, Bangkok (virtual), Thailand. ⟨10.18653/v1/2021.iwslt-1.20⟩
Communication dans un congrès hal-03298854v2
Image document

LeBenchmark: A Reproducible Framework for Assessing Self-Supervised Representation Learning from Speech

Solène Evain , Ha Nguyen , Hang Le , Marcely Zanon Boito , Salima Mdhaffar
INTERSPEECH 2021: Conference of the International Speech Communication Association, Aug 2021, Brno, Czech Republic
Communication dans un congrès hal-03317730v3

Reconnaissance vocale du discours spontané pour le domaine médical

Lucía Ormaechea , Pierrette Bouillon , Johanna Gerlach , Benjamin Lecouteux , Didier Schwab
Technologies du Langage Humain (TLH), Feb 2021, Paris, France
Communication dans un congrès hal-03157085v1
Image document

Task Agnostic and Task Specific Self-Supervised Learning from Speech with LeBenchmark

Solène Evain , Manh Ha Nguyen , Hang Le , Marcely Zanon Boito , Salima Mdhaffar
Thirty-fifth Conference on Neural Information Processing Systems ( NeurIPS 2021), Dec 2021, on-line, United States
Communication dans un congrès hal-03407172v1
Image document

FlauBERT : des modèles de langue contextualisés pré-entraînés pour le français

Hang Le , Loïc Vial , Jibril Frej , Vincent Segonne , Maximin Coavoux
6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 2 : Traitement Automatique des Langues Naturelles, Jun 2020, Nancy, France. pp.268-278
Communication dans un congrès hal-02784776v3
Image document

Evaluation of the acceptability and usability of augmentative and alternative communication (AAC) tools: the example of pictogram grid communication systems with voice output

Lucie Chasseur , Marion Dohen , Benjamin Lecouteux , Sébastien Riou , Amélie Rochet-Capellan
ACM SIGACCESS 2020 - Conference on Computers and Accessibility, Oct 2020, Athènes, Greece. pp.Article 68, ⟨10.1145/3373625.3418018⟩
Communication dans un congrès hal-02896668v2
Image document

FlauBERT: Unsupervised Language Model Pre-training for French

Hang Le , Loïc Vial , Jibril Frej , Vincent Segonne , Maximin Coavoux
LREC, 2020, Marseille, France
Communication dans un congrès hal-02890258v1
Image document

Reconnaissance de parole beatboxée à l'aide d'un système HMM-GMM inspiré de la reconnaissance automatique de la parole

Solène Evain , Adrien Contesse , Antoine Pinchaud , Didier Schwab , Benjamin Lecouteux
JEP-TALN-RECITAL 2020 - 6e conférence conjointe 33e Journées d'Études sur la Parole, 27e Traitement Automatique des Langues Naturelles, 22e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, Jun 2020, Nancy, France. pp.208-216
Communication dans un congrès hal-02798538v3
Image document

The LIG system for the English-Czech Text Translation Task of IWSLT 2019

Loïc Vial , Benjamin Lecouteux , Didier Schwab , Hang Le , Laurent Besacier
IWSLT (16th International Workshop on Spoken Language Translation), 2019, Hong-Kong, China
Communication dans un congrès hal-02443412v1
Image document

Apporter des connaissances sémantiques à un jeu de pictogrammes destiné à des personnes en situation de handicap : Un ensemble de liens entre Wordnet et Arasaac, Arasaac-WN

Didier Schwab , Pauline Trial , Céline Vaschalde , Loïc Vial , Benjamin Lecouteux
TALN 2019, 2019, Toulouse, France
Communication dans un congrès hal-02127258v1

Beatbox sounds recognition using a speech-dedicated HMM-GMM based system

Solène Evain , Adrien Contesse , Antoine Pinchaud , Didier Schwab , B Lecouteux
MAVEBA 2019 - 11th International Workshop on Models and Analysis of Vocal Emissions for Biomedical Applications, Dec 2019, Florence, Italy
Communication dans un congrès hal-02429730v1
Image document

Sense Vocabulary Compression through the Semantic Knowledge of WordNet for Neural Word Sense Disambiguation

Loïc Vial , Benjamin Lecouteux , Didier Schwab
Global Wordnet Conference, 2019, Wroclaw, Poland
Communication dans un congrès hal-02131872v1
Image document

Compression de vocabulaire de sens grâce aux relations sémantiques pour la désambiguïsation lexicale

Loïc Vial , Benjamin Lecouteux , Didier Schwab
TALN 2019 (Conférence sur le Traitement Automatique des Langues Naturelles), Jul 2019, Toulouse, France
Communication dans un congrès hal-02127237v2
Image document

Automatic pictogram generation from speech to help the implementation of a mediated communication

Céline Vaschalde , Pauline Trial , Emmanuelle Esperança-Rodier , Didier Schwab , Benjamin Lecouteux
Conference on Barrier-free Communication, Nov 2018, Geneva, Switzerland
Communication dans un congrès hal-01880744v1
Image document

Génération de pictogrammes à partir de la parole spontanée pour la mise en place d’une communication médiée

Céline Vaschalde , Benjamin Lecouteux , Didier Schwab
50 ans de linguistique sur corpus oraux : Apports à l'étude de la variation, Nov 2018, Orléans, France
Communication dans un congrès hal-01876781v1
Image document

Approche supervisée à base de cellules LSTM bidirectionnelles pour la désambiguïsation lexicale

Loïc Vial , Benjamin Lecouteux , Didier Schwab
25e conférence sur le Traitement Automatique des Langues Naturelles, May 2018, Rennes, France
Communication dans un congrès hal-01781183v1
Image document

La désambiguïsation lexicale d'une langue moins bien dotée, l'exemple de l'arabe

Marwa Hadj Salah , Loïc Vial , Hervé Blanchon , Mounir Zrigui , Benjamin Lecouteux
25e conférence sur le Traitement Automatique des Langues Naturelles, May 2018, Rennes, France
Communication dans un congrès hal-01781185v1
Image document

UFSAC: Unification of Sense Annotated Corpora and Tools

Loïc Vial , Benjamin Lecouteux , Didier Schwab
Language Resources and Evaluation Conference (LREC), May 2018, Miyazaki, Japan
Communication dans un congrès hal-01718237v1
Image document

Uniformisation de corpus anglais annotés en sens

Loïc Vial , Benjamin Lecouteux , Didier Schwab
24ème Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2017, Orléans, France
Communication dans un congrès hal-01599578v1
Image document

Sense Embeddings in Knowledge-Based Word Sense Disambiguation

Loïc Vial , Benjamin Lecouteux , Didier Schwab
12th International Conference on Computational Semantics, Sep 2017, Montpellier, France
Communication dans un congrès hal-01599685v1
Image document

Représentation vectorielle de sens pour la désambiguïsation lexicale à base de connaissances

Loïc Vial , Benjamin Lecouteux , Didier Schwab
24ème Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2017, Orléans, France
Communication dans un congrès hal-01599572v1
Image document

ANT COLONY ALGORITHM APPLIED TO AUTOMATIC SPEECH RECOGNITION GRAPH DECODING

Benjamin Lecouteux , Didier Schwab
Interspeech 2015, Sep 2015, Dresden, Germany
Communication dans un congrès hal-01170535v1
Image document

Décodage de graphe à l'aide de colonies de fourmis

Benjamin Lecouteux , Didier Schwab
30èmes Journées d'étude de la parole, Jun 2014, Le mans, France. pp.6
Communication dans un congrès hal-01003001v1