- 33
- 7
- 4
- 2
- 1
- 1
- 1
Didier Schwab
Professeur des universités (CNU 27)
94%
Libre accès
49
Documents
Affiliations actuelles
Identifiants chercheurs
- didier-schwab
- IdRef : 069192359
- 0000-0002-2462-8148
- Arxiv : schwab_d_2
Présentation
### En bref :
- Enseignant-chercheur en informatique (CNU 27), Professeur des universités
- Membre de l'équipe [GETALP](https://lig-getalp.imag.fr/fr/accueil/) au [Laboratoire Informatique de Grenoble](https://www.liglab.fr) (LIG, UMR 5217), depuis 2007
- Recherches : Grands modèles de langue, représentation, l’acquisition et l’exploitation de connaissances pour et par les textes ; Dialogue assisté par la machine pour les personnes en situation de handicap
- Responsabilités actuelles :
- 2023 - 2024 : Membre élu du Conseil d'Administration de l'Université Grenoble Alpes
- 2022 - : Co-animateur avec Corinne Fredouille (U. d'Avignon, LIA) de l'axe [Cognition et Langage](https://www.institut-cognition.com/innovez-par-la-cognition/cognition-et-langage/) de l'[Institut Carnot Cognition](https://www.institut-cognition.com)
- 2020 - : Chargé de mission valorisation au LIG
- 2020 - : Membre du comité de rédaction de la [revue TAL (Traitement Automatique des Langues)](https://www.atala.org/revuetal)
- 2019 - : Membre du Comité Permanent de la conférence TALN ([https://www.atala.org/comitepermanent](https://www.atala.org/comitepermanent "Traitement Automatique des Langues Naturelles"))
- 2012 - 2024 : Membre du conseil d'administration de l'ATALA ([Association pour le Traitement Automatique des Langues](https://www.atala.org/association "Association pour le Traitement Automatique des Langues"))
Google Scholar : [https://scholar.google.com/citations?hl=fr&user=eKDJXyUAAAAJ ](https://scholar.google.com/citations?hl=fr&user=eKDJXyUAAAAJ)
### Quelques projets
- Pantagruel (2023 -- 2026) : Construction et évaluation de grands modèles de langue multimodaux et inclusifs -- écrit, oral, pictogrammes -- pour le français général et clinique -- financement principal : ANR (600 K) -- rôle : coordinateur du projet
- AAC4All (2022 -- 2025) : Communication augmentée et alternative pour tous -- https://www.aac4all.org -- financement principal : ANR (700 k https://anr.fr/Projet-ANR-21-CE19-0051) -- rôle : coordinateur de site
### Encadrement de doctorant(e)s :
- Lucía Ormaechea Grijalba (2022-) avec Pierrette Bouilllon (Université de Genève, Faculté de traduction et d'interprétation) et Benjamin Lecouteux (UGA, LIG, GETALP) : *Simplification de la parole pour la traduction vers des pictogrammes*
- Fabien Lopez (2022-) *avec Marco Dinarelli (CNRS, LIG, GETALP) et Emmanuelle Esperança-Rodier (UGA, LIG, GETALP) : La résolution de coréférences et son application à la traduction automatique*
- Aidan Mannion (2021-) avec Lorraine Gœuriot (UGA, LIG, GETALP) : *Modéles de langue contextualisés pour la trajectoire patients*
- Cécile Macaire (2021-) avec Benjamin Lecouteux (UGA, LIG, GETALP) et Emmanuelle Esperança-Rodier (UGA, LIG, GETALP) : *Génération de pictogramme à partir de la parole pour la mise en place d’une communication médiée par la machine*
- Jeongwoo KANG (2021-) avec Maximin Coavoux (CNRS, LIG, GETALP) : *Apprentissage par transfert pour l’analyse sémantique*
- Xingyu LIU (2021-) avec François Portet (UGA, LIG, GETALP) : Système dialogique de questions-réponses contrôlé : application aux forums sur la santé des femmes
### Thèses soutenues :
8 LE Hang (Thèse soutenue le 25 mars 2024) avec Benjamin Lecouteux (UGA, LIG, GETALP) : *Model Architectures and Training Techniques for Multilingual Speech-to-Text Translation*
7 Emmanuelle Kelodjoue (Soutenue le 5 octobre 2022) avec Jérôme Goulian (UGA, LIG, GETALP) : *Extraction d’opinions pour l’aide à l’analyse multicritère de corpus oraux transcrits*
6 Jibril Frej (Thèse soutenue le 5 février 2021) avec Jean-Pierre Chevallet (UGA, LIG, MRIM) : *Connaissances a priori pour la Recherche d'Information textuelle basée sur l'apprentissage profond*
5 Loïc Vial (Thèse soutenue le 20 juillet 2020) avec Benjamin Lecouteux (UGA, LIG, GETALP) : *Modèles joints de clarification de texte et de traduction automatique statistique*
4 El Moatez Billah Nagoudi (Thèse soutenue en mars 2019) avec Ahmed Khorsi (Al-Imam Mohammad Ibn Saud Islamic University, Saudi Arabia) et Hadda Cherroun (Laboratoire d’Informatique et de Mathématique LIM, Amar Telidji University, Laghouat, Algeria) : *Détection de plagiat en langue arabe*.
3 Marwa Hadj-Salah (Thèse soutenue en décembre 2018) avec Hervé Blanchon (UGA, LIG, GETALP) et Mounir Zrigui (Université de Monastir, Tunisie) : *Désambiguïsation lexicale de l'arabe pour et par la traduction automatique.*
2 Jérémy Ferrero ([Thèse soutenue en décembre 2017](https://tel.archives-ouvertes.fr/tel-01721390)) avec Laurent Besacier (UGA, LIG, GETALP) et Frédéric Agnès (Société Compilatio) : *Similarités Textuelles Sémantiques Translingues : vers la Détection Automatique du Plagiat par Traduction*.
1 Andon Tchechmedjiev ([Thèse soutenue en octobre 2016](https://tel.archives-ouvertes.fr/tel-01425123/)) avec Gilles Sérasset (UGA, LIG, GETALP) et Jérôme Goulian (UGA, LIG, GETALP) : *Interopérabilité Sémantique Multilingue des Ressources Lexicales en Données Liées Ouvertes.*
### Parcours
Depuis le 1er septembre 2022 : Professeur des universités à l’Université Grenoble Alpes– IUT2 département Techniques de Commercialisation, Laboratoire d’Informatique de Grenoble - Groupe d'Étude en Traduction Automatique et Traitement Automatisé des Langues et de la Parole
sept. 2008 - Août 2022 : Maître de conférences à l’Université Grenoble Alpes– IUT2 département Techniques de Commercialisation, Laboratoire d’Informatique de Grenoble - Groupe d'Étude en Traduction Automatique et Traitement Automatisé des Langues et de la Parole
Sept. 2007 – Août 2008 : Attaché Temporaire d’Enseignement et de Recherche à l’Université Grenoble II – IUT2 département Informatique, Laboratoire d’Informatique de Grenoble - Groupe d'Étude en Traduction Automatique et Traitement Automatisé des Langues et de la Parole
Avril 2006 – Août 2007 : Chargé de recherche, post-doctorat, Unité de Traduction Assistée par Ordinateur (UTMK), Universiti Sains Malaysia, Penang, Malaisie
2001-2005 : Thèse de doctorat, monitorat et Attaché Temporaire d’Enseignement et de Recherche à l’Université Montpellier 2
Publications
- 24
- 46
- 41
- 12
- 4
- 4
- 3
- 3
- 3
- 3
- 3
- 3
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 49
- 13
- 7
- 7
- 7
- 7
- 6
- 6
- 5
- 5
- 5
- 5
- 5
- 5
- 5
- 4
- 4
- 4
- 4
- 4
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 2
- 9
- 4
- 5
- 4
- 6
- 9
- 7
- 2
- 1
|
LeBenchmark 2.0: A standardized, replicable and enhanced framework for self-supervised representations of French speechComputer Speech and Language, 2024, 86, pp.101622. ⟨10.1016/j.csl.2024.101622⟩
Article dans une revue
hal-04441389v1
|
|
Human Beatbox Sound Recognition using an Automatic Speech Recognition ToolkitBiomedical Signal Processing and Control, 2021, 67, pp.102468. ⟨10.1016/j.bspc.2021.102468⟩
Article dans une revue
hal-02896690v2
|
|
Approche supervisée à base de cellules LSTM bidirectionnelles pour la désambiguïsation lexicaleRevue TAL : traitement automatique des langues, 2019
Article dans une revue
hal-02010901v1
|
|
Jargon: A Suite of Language Models and Evaluation Tasks for French Specialized DomainsLREC-COLING 2024 - Joint International Conference on Computational Linguistics, Language Resources and Evaluation, May 2024, Turin, Italy
Communication dans un congrès
hal-04535557v1
|
|
Vers une simplification automatique de la parole en françaisColloque International AFLS 2023 – Le français et ses frontières, Université de Lille, Sep 2023, Villeneuve-d'Ascq, France
Communication dans un congrès
hal-04283197v1
|
|
Plateformes pour la création de données en pictogrammes18e Conférence en Recherche d'Information et Applications, 16e Rencontres Jeunes Chercheurs en RI, 30e Conférence sur le Traitement Automatique des Langues Naturelles, 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, 2023, Paris, France. pp.6-9
Communication dans un congrès
hal-04208581v1
|
|
PROPICTO: Developing Speech‑to‑Pictograph Translation Systems to Enhance Communication Accessibility24th Annual Conference of The European Association for Machine Translation (EAMT), European Association for Machine Translation; Tampere University; University of Eastern Finland, Jun 2023, Tampere, Finland. pp.515-516
Communication dans un congrès
hal-04283267v1
|
|
Voice2Picto : un système de traduction automatique de la parole vers des pictogrammes18e Conférence en Recherche d'Information et Applications, 16e Rencontres Jeunes Chercheurs en RI, 30e Conférence sur le Traitement Automatique des Langues Naturelles, 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, 2023, Paris, France. pp.10-13
Communication dans un congrès
hal-04208583v1
|
Simple, Simpler and Beyond: A Fine-Tuning BERT-Based Approach to Enhance Sentence Complexity Assessment for Text SimplificationICNLSP (International Conference on Natural Language and Speech Processing), University of Trento, Dec 2023, Trento, Italy
Communication dans un congrès
hal-04439105v1
|
|
|
PROPICTO: Developing Speech-to-Pictograph Translation Systems to Enhance Communication AccessibilityEuropean Association for Machine Translation, Jun 2023, Tampere, Finland
Communication dans un congrès
hal-04241457v1
|
|
PROPICTO : Développer des systèmes de traduction de la parole vers des séquences de pictogrammes pour améliorer l'accessibilité de la communication18e Conférence en Recherche d'Information et Applications, 16e Rencontres Jeunes Chercheurs en RI, 30e Conférence sur le Traitement Automatique des Langues Naturelles, 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, 2023, Paris, France. pp.32-35
Communication dans un congrès
hal-04208597v1
|
|
Pre-training for Speech Translation: CTC Meets Optimal TransportInternational Conference on Machine Learning (ICML), 2023, Jul 2023, Honolulu, Hawaii, United States
Communication dans un congrès
hal-04117237v1
|
|
Simple, Simpler and Beyond: A Fine-Tuning BERT-Based Approach to Enhance Sentence Complexity Assessment for Text SimplificationICNLSP (International Conference on Natural Language and Speech Processing), University of Trento, Dec 2023, Trento, Italy
Communication dans un congrès
hal-04359942v1
|
|
LeBenchmark, un référentiel d'évaluation pour le français oral *34e Journées d'étude sur la parole JEP 2022, Jun 2022, île de Noirmoutier, France
Communication dans un congrès
hal-03767742v1
|
|
A Tool for Easily Integrating Grammars as Language Models into the Kaldi Speech Recognition ToolkitEuropean Summer School in Logic, Language and Information (ESSLI), Aug 2022, Galway, Ireland
Communication dans un congrès
hal-03722458v1
|
|
Modèles neuronaux pré-appris par auto-supervision sur des enregistrements de parole en françaisJEP 2022, Jun 2022, île de Noirmoutier, France
Communication dans un congrès
hal-03707064v1
|
|
Automatic Speech Recognition and Query By Example for Creole Languages DocumentationFindings of the Association for Computational Linguistics: ACL 2022, May 2022, Dublin, Ireland
Communication dans un congrès
hal-03625303v1
|
|
ON-TRAC' systems for the IWSLT 2021 low-resource speech translation and multilingual speech translation shared tasksInternational Conference on Spoken Language Translation (IWSLT), Aug 2021, Bangkok (virtual), Thailand. ⟨10.18653/v1/2021.iwslt-1.20⟩
Communication dans un congrès
hal-03298854v2
|
|
LeBenchmark: A Reproducible Framework for Assessing Self-Supervised Representation Learning from SpeechINTERSPEECH 2021: Conference of the International Speech Communication Association, Aug 2021, Brno, Czech Republic
Communication dans un congrès
hal-03317730v3
|
Reconnaissance vocale du discours spontané pour le domaine médicalTechnologies du Langage Humain (TLH), Feb 2021, Paris, France
Communication dans un congrès
hal-03157085v1
|
|
|
Task Agnostic and Task Specific Self-Supervised Learning from Speech with LeBenchmarkThirty-fifth Conference on Neural Information Processing Systems ( NeurIPS 2021), Dec 2021, on-line, United States
Communication dans un congrès
hal-03407172v1
|
|
FlauBERT : des modèles de langue contextualisés pré-entraînés pour le français6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 2 : Traitement Automatique des Langues Naturelles, Jun 2020, Nancy, France. pp.268-278
Communication dans un congrès
hal-02784776v3
|
|
Evaluation of the acceptability and usability of augmentative and alternative communication (AAC) tools: the example of pictogram grid communication systems with voice outputACM SIGACCESS 2020 - Conference on Computers and Accessibility, Oct 2020, Athènes, Greece. pp.Article 68, ⟨10.1145/3373625.3418018⟩
Communication dans un congrès
hal-02896668v2
|
|
FlauBERT: Unsupervised Language Model Pre-training for FrenchLREC, 2020, Marseille, France
Communication dans un congrès
hal-02890258v1
|
|
Reconnaissance de parole beatboxée à l'aide d'un système HMM-GMM inspiré de la reconnaissance automatique de la paroleJEP-TALN-RECITAL 2020 - 6e conférence conjointe 33e Journées d'Études sur la Parole, 27e Traitement Automatique des Langues Naturelles, 22e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, Jun 2020, Nancy, France. pp.208-216
Communication dans un congrès
hal-02798538v3
|
|
The LIG system for the English-Czech Text Translation Task of IWSLT 2019IWSLT (16th International Workshop on Spoken Language Translation), 2019, Hong-Kong, China
Communication dans un congrès
hal-02443412v1
|
|
Apporter des connaissances sémantiques à un jeu de pictogrammes destiné à des personnes en situation de handicap : Un ensemble de liens entre Wordnet et Arasaac, Arasaac-WNTALN 2019, 2019, Toulouse, France
Communication dans un congrès
hal-02127258v1
|
Beatbox sounds recognition using a speech-dedicated HMM-GMM based systemMAVEBA 2019 - 11th International Workshop on Models and Analysis of Vocal Emissions for Biomedical Applications, Dec 2019, Florence, Italy
Communication dans un congrès
hal-02429730v1
|
|
|
Sense Vocabulary Compression through the Semantic Knowledge of WordNet for Neural Word Sense DisambiguationGlobal Wordnet Conference, 2019, Wroclaw, Poland
Communication dans un congrès
hal-02131872v1
|
|
Compression de vocabulaire de sens grâce aux relations sémantiques pour la désambiguïsation lexicaleTALN 2019 (Conférence sur le Traitement Automatique des Langues Naturelles), Jul 2019, Toulouse, France
Communication dans un congrès
hal-02127237v2
|
|
Automatic pictogram generation from speech to help the implementation of a mediated communicationConference on Barrier-free Communication, Nov 2018, Geneva, Switzerland
Communication dans un congrès
hal-01880744v1
|
|
Génération de pictogrammes à partir de la parole spontanée pour la mise en place d’une communication médiée50 ans de linguistique sur corpus oraux : Apports à l'étude de la variation, Nov 2018, Orléans, France
Communication dans un congrès
hal-01876781v1
|
|
Approche supervisée à base de cellules LSTM bidirectionnelles pour la désambiguïsation lexicale25e conférence sur le Traitement Automatique des Langues Naturelles, May 2018, Rennes, France
Communication dans un congrès
hal-01781183v1
|
|
La désambiguïsation lexicale d'une langue moins bien dotée, l'exemple de l'arabe25e conférence sur le Traitement Automatique des Langues Naturelles, May 2018, Rennes, France
Communication dans un congrès
hal-01781185v1
|
|
UFSAC: Unification of Sense Annotated Corpora and ToolsLanguage Resources and Evaluation Conference (LREC), May 2018, Miyazaki, Japan
Communication dans un congrès
hal-01718237v1
|
|
Uniformisation de corpus anglais annotés en sens 24ème Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2017, Orléans, France
Communication dans un congrès
hal-01599578v1
|
|
Sense Embeddings in Knowledge-Based Word Sense Disambiguation12th International Conference on Computational Semantics, Sep 2017, Montpellier, France
Communication dans un congrès
hal-01599685v1
|
|
Représentation vectorielle de sens pour la désambiguïsation lexicale à base de connaissances24ème Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2017, Orléans, France
Communication dans un congrès
hal-01599572v1
|
|
ANT COLONY ALGORITHM APPLIED TO AUTOMATIC SPEECH RECOGNITION GRAPH DECODINGInterspeech 2015, Sep 2015, Dresden, Germany
Communication dans un congrès
hal-01170535v1
|
|
Décodage de graphe à l'aide de colonies de fourmis30èmes Journées d'étude de la parole, Jun 2014, Le mans, France. pp.6
Communication dans un congrès
hal-01003001v1
|
|
UFSAC: Unification of Sense Annotated Corpora and ToolsLREC, 2018, Miyazaki, Japan
Poster de conférence
hal-02093190v1
|
|
Représentation vectorielle de sens pour la désambiguïsation lexicale à base de connaissancesTALN, 2017, Orléans, France
Poster de conférence
hal-02094759v1
|
|
Sense Embeddings in Knowledge-Based Word Sense DisambiguationIWCS, 2017, Montpellier, France
Poster de conférence
hal-02094762v1
|
|
Uniformisation de corpus anglais annotés en sens24ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), Jun 2017, Orléans, France
Poster de conférence
hal-01955673v1
|
|
Ant Colony Algorithm Applied to Automatic speech Recognition Graph DecodingInterspeech, 2015, Dresde, Germany
Poster de conférence
hal-02094738v1
|
|
Automatic pictogram generation from speech to help the implementation of a mediated communication[Research Report] LIG; UGA (Université Grenoble Alpes). 2018
Rapport
hal-01887439v1
|
|
WSD[Research Report] LIG. 2018
Rapport
hal-01940293v1
|
|
Approche supervisée à base de cellules LSTM bidirectionnelles pour la désambiguïsation lexicale.[Rapport de recherche] UGA - Université Grenoble Alpes. 2018
Rapport
hal-01753343v1
|
|
UFSAC: Unification of Sense Annotated Corpora and Tools[Research Report] UGA - Université Grenoble Alpes. 2017
Rapport
hal-01680739v1
|