Yannick Estève
Professor in Computer Science - Head of LIA - Avignon University
176
Documents
Identifiants chercheurs
- yannick-esteve
- 0000-0002-3656-8883
- Google Scholar : https://scholar.google.fr/citations?user=dQDAeBYAAAAJ&hl=fr&oi=ao
- IdRef : 070531668
Présentation
My main research interests are speech and language processing.
I have studied Computer Science (Licence and Master's degree) at the Faculty of Sciences of Luminy (Marseille, France). I obtained my PhD on 2002, under the direction of Pr. Renato De Mori, at the Computer Science Labs (LIA) of the University of Avignon (Avignon, France), in association with France Telecom R&D (FTRD, now Orange Labs).
I have worked since June 2002 with FTRD as a research engineer, then as a post-doctoral researcher until August 2003.
Then, I have worked until 2018 at the Computer Science Labs (LIUM) of the University of Le Mans (France), from September 2003 as an associate professor, becoming a full professor in 2010.
I have headed the [LIUM](https://lium.univ-lemans.fr/en/) from 2012 to 2016 and was a co-founder of the Language and Speech Technology (LST) team of this lab.
From 2015 to 2018, I was also the head of the Claude Chappe Informatics Institute that coordinates research, teaching, and innovation activities on computer science at the University of Le Mans.
In 2018, I moved to the Computer Science Labs of Avignon (LIA) at the University of Avignon.
In May 2020, I became the head of [LIA](https://lia.univ-avignon.fr/en/).
My current research activities focus on spoken language understanding, speech translation, speech analytics, speech recognition, deep neural networks, word embeddings, hidden representation.
Currently , I am leading the E-SSL project funded by the ANR (French Research Agency) on efficient self supervised learning for speech processing, and I am the LIA scientific responsible in the H2020 SELMA project focusing on transfer learning and user feedback for speech and language processing.
Domaines de recherche
Publications
- 9
- 7
- 5
- 5
- 5
- 4
- 4
- 4
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 37
- 36
- 23
- 22
- 22
- 17
- 17
- 16
- 16
- 14
- 14
- 14
- 12
- 10
- 10
- 8
- 8
- 7
- 7
- 7
- 6
- 6
- 6
- 6
- 6
- 6
- 6
- 5
- 5
- 5
- 5
- 5
- 5
- 5
- 5
- 5
- 5
- 5
- 5
- 5
- 4
- 4
- 4
- 4
- 4
- 4
- 4
- 4
- 4
- 4
- 4
- 4
- 4
- 4
- 4
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 119
- 44
- 12
- 1
- 3
- 11
- 9
- 13
- 10
- 16
- 7
- 15
- 11
- 13
- 3
- 9
- 4
- 9
- 8
- 15
- 2
- 4
- 1
- 2
- 3
- 2
- 3
- 2
- 1
- 3
- 2
- 1
- 1
- 1
- 1
- 1
- 8
- 6
- 6
- 4
- 3
- 3
- 3
- 2
- 1
- 1
- 1
- 4
- 4
|
A study of continuous space word and sentence representations applied to ASR error detectionSpeech Communication, 2020
Article dans une revue
hal-02501943v1
|
|
Automatic speech recognition system for Tunisian dialectLanguage Resources and Evaluation, 2018, 52 (1), pp.249-267. ⟨10.1007/s10579-017-9402-y⟩
Article dans une revue
hal-01592416v1
|
|
ArchimorphosisReconstruction (cultural studies journal), special edition: Archives on Fire, 2016, 16 (1)
Article dans une revue
hal-02106396v1
|
Reconnaissance automatique de la paroleL'information grammaticale, 2014, TRAITEMENTS AUTOMATIQUES DE L’ORAL ET DE L’ÉCRIT (1) Panorama des recherches et des technologies actuelles, 141, pp.10
Article dans une revue
hal-01135037v1
|
|
Characterizing and Detecting Spontaneous Speech: Application To Speaker Role RecognitionSpeech Communication, 2014, 56, pp.1--18
Article dans une revue
hal-01433222v1
|
|
|
Dynamic Combination of Automatic Speech Recognition Systems by Driven DecodingIEEE Transactions on Audio, Speech and Language Processing, 2013
Article dans une revue
hal-00758626v1
|
|
Analyse conjointe du signal sonore et de sa transcription pour l'identification nommée de locuteursRevue TAL : traitement automatique des langues, 2009, 50 (1), pp.201-225
Article dans une revue
hal-00412446v1
|
La parole spontanée : transcription et traitementRevue TAL : traitement automatique des langues, 2008
Article dans une revue
hal-01321127v1
|
|
Systèmes de transcription automatique de la parole et logiciels libresRevue TAL : traitement automatique des langues, 2004, 45 (2)
Article dans une revue
hal-01434482v1
|
|
On the use of linguistic consistency in automatic speech recognitionIEEE Transactions on Speech and Audio Processing, 2003, 11 (6), pp.746--756
Article dans une revue
hal-01434539v1
|
|
Learning Multilingual Expressive Speech Representation for Prosody Prediction without Parallel DataSpeech Synthesis Workshop (SSW), Aug 2023, Grenoble, France
Communication dans un congrès
hal-04144850v1
|
|
The Spoken Language Understanding MEDIA Benchmark Dataset in the Era of Deep Learning: data updates, training and evaluation toolsLREC 2022, Jun 2022, Marseille, France
Communication dans un congrès
hal-03706938v1
|
|
Retrieving Speaker Information from Personalized Acoustic Models for Speech RecognitionIEEE ICASSP 2022, 2022, Singapour, Singapore
Communication dans un congrès
hal-03539741v1
|
|
Impact Analysis of the Use of Speech and Language Models Pretrained by Self-Supersivion for Spoken Language UnderstandingLREC 2022, Jun 2022, Marseille, France
Communication dans un congrès
hal-03706925v1
|
|
End-to-end model for named entity recognition from speech without paired training dataInterspeech 2022, Sep 2022, Incheon, South Korea
Communication dans un congrès
hal-03701145v1
|
|
On speaker verification from the neural network footprint of personalized acoustic modelsJournées d'Études sur la Parole - JEP2022, Jun 2022, Île de Noirmoutier, France
Communication dans un congrès
hal-03626964v1
|
|
Modèles neuronaux pré-appris par auto-supervision sur des enregistrements de parole en françaisJEP 2022, Jun 2022, île de Noirmoutier, France
Communication dans un congrès
hal-03707064v1
|
|
Le benchmark MEDIA revisité : données, outils et évaluation dans un contexte d'apprentissage profondXXXIVe Journées d'Études sur la Parole -- JEP 2022, Jun 2022, île de Noirmoutier, France
Communication dans un congrès
hal-03770588v1
|
|
Extraction d'informations liées au locuteur depuis un modèle acoustique personnaliséJEP 2022, Jun 2022, île de Noirmoutier, France
Communication dans un congrès
hal-03706944v1
|
|
Privacy attacks for automatic speech recognition acoustic models in a federated learning frameworkICASSP 2022, 2022, Singapour, Singapore
Communication dans un congrès
hal-03539742v2
|
|
Continuous emotion prediction from audio signal with acoustic and linguistic representations16ème Congrès Français d'Acoustique, CFA2022, Société Française d'Acoustique; Laboratoire de Mécanique et d'Acoustique, Apr 2022, Marseille, France
Communication dans un congrès
hal-03847806v1
|
End2End Acoustic to Semantic TransductionICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Jun 2021, Toronto, ON, Canada. ⟨10.1109/ICASSP39728.2021.9413581⟩
Communication dans un congrès
hal-03128163v1
|
|
|
Impact of Encoding and Segmentation Strategies on End-to-End Simultaneous Speech TranslationINTERSPEECH 2021, Aug 2021, Brno, Czech Republic
Communication dans un congrès
hal-03372487v1
|
|
Where are we in semantic concept extraction for Spoken Language Understanding? ⋆SPECOM 2021 23rd International Conference on Speech and Computer, Sep 2021, Saint Petersburg, Russia
Communication dans un congrès
hal-03372494v1
|
|
AN EMPIRICAL STUDY OF END-TO-END SIMULTANEOUS SPEECH TRANSLATION DECODING STRATEGIESIEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2021), Jun 2021, Toronto, Canada. ⟨10.1109/ICASSP39728.2021.9414276⟩
Communication dans un congrès
hal-03372480v1
|
|
Task Agnostic and Task Specific Self-Supervised Learning from Speech with LeBenchmarkThirty-fifth Conference on Neural Information Processing Systems ( NeurIPS 2021), Dec 2021, on-line, United States
Communication dans un congrès
hal-03407172v1
|
|
Study on Acoustic Model Personalization in a Context of Collaborative Learning Constrained by Privacy PreservationSPECOM 2021 - 23rd International Conference on Speech and Computer, Sep 2021, St Petersburg, Russia. pp.426 - 436, ⟨10.1007/978-3-030-87802-3_39⟩
Communication dans un congrès
hal-03369206v1
|
|
ON-TRAC' systems for the IWSLT 2021 low-resource speech translation and multilingual speech translation shared tasksInternational Conference on Spoken Language Translation (IWSLT), Aug 2021, Bangkok (virtual), Thailand. ⟨10.18653/v1/2021.iwslt-1.20⟩
Communication dans un congrès
hal-03298854v2
|
|
LeBenchmark: A Reproducible Framework for Assessing Self-Supervised Representation Learning from SpeechINTERSPEECH 2021: Conference of the International Speech Communication Association, Aug 2021, Brno, Czech Republic
Communication dans un congrès
hal-03317730v3
|
|
On the use of Self-supervised Pre-trained Acoustic and Linguistic Features for Continuous Speech Emotion RecognitionIEEE Spoken Language Technology Workshop, Jan 2021, Virtual, China
Communication dans un congrès
hal-03003469v1
|
|
Investigating Self-supervised Pre-training for End-to-end Speech TranslationInterspeech 2020, Oct 2020, Shangai (Virtual Conf), China
Communication dans un congrès
hal-02962186v1
|
|
Multi-corpus Experiment on Continuous Speech Emotion Recognition: Convolution or Recurrence?22ND INTERNATIONAL CONFERENCE ON SPEECH AND COMPUTER SPECOM 2020, Oct 2020, St Petersburg, Russia
Communication dans un congrès
hal-02945644v1
|
Where are we in Named Entity Recognition from Speech?12th International Conference on Language Resources and Evaluation (LREC), May 2020, Marseille, France
Communication dans un congrès
hal-02475026v1
|
|
|
Où en sommes-nous dans la reconnaissance des entités nommées structurées à partir de la parole ?6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d'Études sur la Parole, 2020, Nancy, France. pp.64-72
Communication dans un congrès
hal-02798516v3
|
|
AlloSat: A New Call Center French Corpus for Satisfaction and Frustration AnalysisLanguage Resources and Evaluation Conference, LREC 2020, May 2020, Marseille, France
Communication dans un congrès
hal-02506086v1
|
|
Prédiction continue de la satisfaction et de la frustration dans des conversations de centre d’appels6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d'Études sur la Parole, Jun 2020, Nancy, France. pp.379-387
Communication dans un congrès
hal-02798561v3
|
Error analysis applied to end-to end spoken language understanding45th International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2020), May 2020, Barcelona, Spain. pp.8514-8518, ⟨10.1109/ICASSP40776.2020.9054455⟩
Communication dans un congrès
hal-02465899v1
|
|
|
Confidence measure for speech-to-concept end-to-end spoken language understandingInterspeech 2020, Oct 2020, Shangaï, China
Communication dans un congrès
hal-02940028v1
|
Dialogue History Integration into End-to-End Signal-to-Concept Spoken Language Understanding SystemsICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Apr 2020, Barcelona, Spain. pp.5, ⟨10.1109/ICASSP40776.2020.9053247⟩
Communication dans un congrès
hal-02551760v1
|
|
|
A Multimodal Educational Corpus of Oral Courses: Annotation, Analysis and Case StudyLREC, May 2020, Marseille, France
Communication dans un congrès
hal-02496700v1
|
|
ON-TRAC Consortium for End-to-End and Simultaneous Speech Translation Challenge Tasks at IWSLT 2020Proceedings of the 17th International Conference on Spoken Language Translation, Jul 2020, Seattle, WA, United States. pp.35-43, ⟨10.18653/v1/2020.iwslt-1.2⟩
Communication dans un congrès
hal-02895893v1
|
|
Curriculum-based transfer learning for an effective end-to-end spoken language understanding and domain portability20th Annual Conference of the International Speech Communication Association (InterSpeech), Sep 2019, Graz, Austria. pp.1198-1202, ⟨10.21437/interspeech.2019-1832⟩
Communication dans un congrès
hal-02304597v1
|
Qualitative Evaluation of ASR Adaptation in a Lecture Context: Application to the PASTEL CorpusInterspeech 2019, Sep 2019, Graz, Austria. pp.569-573, ⟨10.21437/Interspeech.2019-2661⟩
Communication dans un congrès
hal-02304620v1
|
|
|
Apport de l'adaptation automatique des modèles de langage pour la reconnaissance de la parole: évaluation qualitative extrinsèque dans un contexte de traitement de cours magistraux26e Conférence sur le Traitement Automatique des Langues Naturelles, 2019, Toulouse, France. pp.167-174
Communication dans un congrès
hal-02567766v1
|
Plongements lexicaux spécifiques à la langue arabe : application à l'analyse d'opinions26e conférence sur le Traitement Automatique des Langues Naturelles (TALN 2019), Jul 2019, Toulouse, France. pp.381-390
Communication dans un congrès
hal-02567780v1
|
|
|
ON-TRAC Consortium End-to-End Speech Translation Systems for the IWSLT 2019 Shared Task16th International Workshop on Spoken Language Translation 2019, Nov 2019, Hong Kong, China
Communication dans un congrès
hal-02352949v1
|
|
Recent Advances in End-to-End Spoken Language Understanding7th International Conference on Statistical Language and Speech Processing (SLSP), Oct 2019, Ljubljana, Slovenia
Communication dans un congrès
hal-02353011v1
|
|
Curriculum d'apprentissage : reconnaissance d'entités nommées pour l'extraction de concepts sémantiques26e conférence sur le Traitement Automatique des Langues Naturelles (TALN), Jul 2019, Toulouse, France
Communication dans un congrès
hal-02304614v1
|
|
Investigating Adaptation and Transfer Learning for End-to-End Spoken Language Understanding from SpeechInterspeech 2019, Sep 2019, Graz, Austria. pp.824-828, ⟨10.21437/Interspeech.2019-2158⟩
Communication dans un congrès
hal-02307811v1
|
An Empirical Evaluation of Arabic-Specific Embeddings for Sentiment AnalysisInternational Conference on Arabic Language Processing, Oct 2019, Nancy, France. pp.34-48, ⟨10.1007/978-3-030-32959-4_3⟩
Communication dans un congrès
hal-02320120v1
|
|
Apport de l’adaptation automatique des modèles de langage pour la reconnaissance de la parole : évaluation qualitative extrinsèque dans un contexte de traitement de cours magistrauxTALN, Jul 2019, Toulouse, France
Communication dans un congrès
hal-02178478v1
|
|
Représentations de phrases dans un espace continu spécifiques à la tâche de détection d'erreursXXXIIe Journées d'Etudes sur la Parole (JEP 2018), Jun 2018, Aix-en-Provence, France
Communication dans un congrès
hal-01757774v1
|
|
|
Des représentations continues de mots pour l'analyse d'opinions en arabe: une étude qualitative25e conférence sur le Traitement Automatique des Langues Naturelles (TALN 2018), May 2018, Rennes, France
Communication dans un congrès
hal-01757776v2
|
FrNewsLink : a corpus linking TV Broadcast News Segments and Press ArticlesLREC - Language Resources Evaluation Conference, May 2018, Miyazaki, Japan
Communication dans un congrès
hal-01741177v1
|
|
Task Specific Sentence Embeddings for ASR Error DetectionInterspeech 2018, Sep 2018, Hyderabad, India. ⟨10.21437/Interspeech.2018-2211⟩
Communication dans un congrès
hal-01870864v1
|
|
Impact des techniques d'adaptation au locuteur dans l'espace des paramètres pour des modèles acoustiques purement neuronauxXXXIIe Journées d'Etudes sur la Parole, Jun 2018, Aix-en-Provence, France
Communication dans un congrès
hal-01757772v1
|
|
Speaker Adaptive Training and Mixup Regularization for Neural Network Acoustic Models in Automatic Speech RecognitionInterspeech 2018, Sep 2018, Hyderabad, India. ⟨10.21437/Interspeech.2018-2209⟩
Communication dans un congrès
hal-01870865v1
|
|
Acoustic-dependent Phonemic Transcription for Text-to-speech SynthesisInterspeech 2018, Sep 2018, Hyderabad, India. ⟨10.21437/Interspeech.2018-1306⟩
Communication dans un congrès
hal-01870866v1
|
|
|
Simulation d'erreurs de reconnaissance automatique dans un cadre de compréhension de la paroleXXXIIe Journées d'Etudes sur la Parole (JEP 2018), Jun 2018, Aix-en-Provence, France
Communication dans un congrès
hal-01757770v1
|
Etude de performance des réseaux neuronaux récurrents dans le cadre de la campagne d'évaluation Multi-Genre Broadcast challenge 3 (MGB3)XXXIIe Journées d'Etudes sur la Parole (JEP 2018), Jun 2018, Aix-en-Provence, France
Communication dans un congrès
hal-01757773v1
|
|
Transcription phonétique automatique pour la synthèse de la paroleXXXIIe Journées d'Etudes sur la Parole (JEP 2018), Jun 2018, Aix-en-Provence, France
Communication dans un congrès
hal-01761937v1
|
|
|
Evaluation of Feature-Space Speaker Adaptation for End-to-End Acoustic ModelsLREC 2018, May 2018, Miyazaki, Japan
Communication dans un congrès
hal-01728526v1
|
|
Simulating ASR errors for training SLU systemsLREC 2018, May 2018, Miyazaki, Japan
Communication dans un congrès
hal-01715923v1
|
|
Arabic Sentiment analysis: an empirical study of machine translation's impactLANGUAGE PROCESSING AND KNOWLEDGE MANAGEMENT INTERNATIONAL CONFERENCE (LPKM2018), Oct 2018, Sfax, Tunisia
Communication dans un congrès
hal-02042313v1
|
|
End-to-end named entity and semantic concept extraction from speechIEEE Spoken Language Technology Workshop, Dec 2018, Athens, Greece
Communication dans un congrès
hal-01987740v2
|
Le corpus PASTEL pour le traitement automatique de cours magistraux25e conférence sur le Traitement Automatique des Langues Naturelles (TALN 2018), May 2018, Rennes, France
Communication dans un congrès
hal-01757775v1
|
|
|
Enriching confusion networks for post-processingStatistical Language and Speech Processing 2017, Oct 2017, Le Mans, France
Communication dans un congrès
hal-01585768v1
|
|
Document embeddings for Arabic Sentiment AnalysisConference on Language Processing and Knowledge Management, LPKM 2017, Sep 2017, Sfax, Tunisia
Communication dans un congrès
hal-02042060v1
|
|
Error detection of grapheme-to-phoneme conversion in text-to-speech synthesis using speech signal and lexical context2017 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU), Dec 2017, Okinawa, Japan. ⟨10.1109/ASRU.2017.8269004⟩
Communication dans un congrès
hal-01585770v1
|
|
Evaluating Automatic Topic Segmentation as a Segment Retrieval TaskInterspeech 2017, Aug 2017, Stockholm, Sweden. pp.2924 - 2928, ⟨10.21437/Interspeech.2017-1231⟩
Communication dans un congrès
hal-01585769v1
|
|
ASR error management for improving spoken language understandingInterspeech 2017, Aug 2017, Stockholm, Sweden
Communication dans un congrès
hal-01526298v1
|
|
Sentiment Analysis of Tunisian Dialects: Linguistic Ressources and Experiments Third Arabic Natural Language Processing Workshop (WANLP), Apr 2017, Valence, Spain. pp.55-61, ⟨10.18653/v1/W17-1307⟩
Communication dans un congrès
hal-01592418v1
|
Title assignment for automatic topic segments in TV Broadcast News41st IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2016), 2016, Shangai, China
Communication dans un congrès
hal-01433186v1
|
|
Word embedding evaluation and combination10th edition of the Language Resources and Evaluation Conference (LREC 2016), 2016, Portorož, Slovenia
Communication dans un congrès
hal-01433185v1
|
|
Recent improvements on error detection for automatic speech recognition1st International Workshop on Multimodal Media Data Analytics (MMDA 2016), in Conjunction with the 22nd European Conference on Artificial Intelligence, 2016, The Hague The, Netherlands
Communication dans un congrès
hal-01433168v1
|
|
LIUM ASR systems for the 2016 Multi-Genre Broadcast Arabic ChallengeIEEE Workshop on Spoken Language Technology, Dec 2016, San Diego, CA, USA, United States. ⟨10.1109/SLT.2016.7846278⟩
Communication dans un congrès
hal-01433188v1
|
|
Enhancing the RATP-DECODA corpus with linguistic annotations for performing a large range of NLP tasks10th edition of the Language Resources and Evaluation Conference (LREC 2016), 2016, Portorož, Slovenia
Communication dans un congrès
hal-01433189v1
|
|
Utilisation des représentations continues des mots et des paramètres prosodiques pour la détection d’erreurs dans les transcriptions automatiques de la parole31ème Journées d’Études sur la Parole, 2016, Paris, France
Communication dans un congrès
hal-01450277v1
|
|
Conditional Random Fields for the Tunisian Dialect Grapheme-to-Phoneme ConversionInterspeech 2016, 2016, San Francisco (CA, USA), Unknown Region
Communication dans un congrès
hal-01433177v1
|
|
|
Exploring GMM-derived Features for Unsupervised Adaptation of Deep Neural Network Acoustic Models18th International Conference on Speech and Computer, 2016, Budapest, Hungary
Communication dans un congrès
hal-01433184v1
|
|
Exploration de paramètres acoustiques dérivés de GMMs pour l'adaptation non supervisée de modèles acoustiques à base de réseaux de neurones profondsJournées d’Études sur la Parole (JEP'16), 2016, Paris, France
Communication dans un congrès
hal-01456899v1
|
Evaluation of acoustic word embeddingsRepEval@ACL 2016: The 1st Workshop on Evaluating Vector-Space Representations for NLP, 2016, Berlin, Germany
Communication dans un congrès
hal-01433181v1
|
|
Acoustic word embeddings for ASR error detectionInterspeech 2016, 2016, San Francisco (CA, USA), Unknown Region
Communication dans un congrès
hal-01433176v1
|
|
On the Use of Gaussian Mixture Model Framework to Improve Speaker Adaptation of Deep Neural Network Acoustic ModelsInterspeech 2016, 2016, San Francisco (CA, USA), Unknown Region
Communication dans un congrès
hal-01433178v1
|
|
A New Perspective on Combining GMM and DNN Frameworks for Speaker Adaptation4th International Conference on Statistical Language and Speech Processing - SLSP 2016, 2016, Pilsen, Czech Republic
Communication dans un congrès
hal-01433182v1
|
|
|
Des Réseaux de Neurones avec Mécanisme d’Attention pour la Compréhension de la Parole31ème Journées d’Études sur la Parole, 2016, Paris, France
Communication dans un congrès
hal-01433191v1
|
Combining continous word representation and prosodic features for ASR error prediction3rd International Conference on Statistical Language and Speech Processing (SLSP 2015), 2015, Budapest, Hungary
Communication dans un congrès
hal-01433203v1
|
|
Diachronic Semantic Cohesion for Topic Segmentation of TV Broadcast NewsInterspeech 2015, 2015, Dresden, Germany
Communication dans un congrès
hal-01450370v1
|
|
Segmentation et titrage automatique de journaux télévisésConférence sur le Traitement Automatique des Langues Naturelles (TALN), 2015, Caen, France
Communication dans un congrès
hal-01433208v1
|
|
CRIM and LIUM approaches for Multi-Genre Broadcast Media TranscriptionASRU 2015, 2015, Scottsdale (Arizona (USA) ), Unknown Region
Communication dans un congrès
hal-01433197v1
|
|
|
The LIUM ASR and SLT Systems for IWSLT 201512th International Workshop on Spoken Language Translation (IWSLT 2015), 2015, Da Nang, Vietnam
Communication dans un congrès
hal-01433206v1
|
|
Exploring the use of Attention-Based Recurrent Neural Networks For Spoken Language UnderstandingMachine Learning for Spoken Language Understanding and Interaction NIPS 2015 workshop (SLUNIPS 2015), 2015, Montreal, Canada
Communication dans un congrès
hal-01433202v1
|
Integration of word and semantic features for theme identification in telephone conversations6th International Workshop on Spoken Dialog Systems (IWSDS 2015), 2015, Busan, South Korea
Communication dans un congrès
hal-01433213v1
|
|
Utilisation d'annotations sémantiques pour la validation automatique d'hypothèses dans des conversations téléphoniquesTALN 2015, 2015, Caen, France
Communication dans un congrès
hal-01433216v1
|
|
Which ASR errors are hard to detect?Workshop Errors by Humans and Machines in multimedia, multimodal and multilingual data processing (ERRARE 2015), 2015, Sinaia, Romania
Communication dans un congrès
hal-01433201v1
|
|
Word embeddings combination and neural networks for robustness in ASR error detection2015 European Signal Processing Conference (EUSIPCO 2015), 2015, Nice, France
Communication dans un congrès
hal-01433210v1
|
|
|
Nao is doing humour in the CHIST-ERA JOKER project16th Interspeech, Sep 2015, Dresde, Germany. pp.1072-1073
Communication dans un congrès
hal-01206698v1
|
Enhancing the TED-LIUM corpus with selected data for language modeling and more TED TalksThe 9th edition of the Language Resources and Evaluation Conference (LREC 2014), 2014, Reykjavik, Iceland
Communication dans un congrès
hal-01433246v1
|
|
|
Recent Improvements on ILP-based Clustering for Broadcast News Speaker DiarizationOdyssey 2014: The Speaker and Language Recognition Workshop, 2014, Joensuu, Finland
Communication dans un congrès
hal-01433239v1
|
Décodage hybride dans les SRAP pour l’indexation automatique des documents multimédiaJEP 2014, 2014, Le Mans, France
Communication dans un congrès
hal-01433219v1
|
|
|
Is Incremental Cross-Show Speaker Diarization Efficient For Processing Large Volumes of Data?Interspeech, 2014, Singapour, Singapore
Communication dans un congrès
hal-01433257v1
|
The LIUM English-to-French Spoken Language Translation System and the Vecsys/LIUM Automatic Speech Recognition System for Italian Language for IWSLT 2014International Workshop on Spoken Language Translation (IWSLT), 2014, Lake Tahoe (USA), Unknown Region
Communication dans un congrès
hal-01433228v1
|
|
Phonetic tool for the Tunisian ArabicSLTU'2014, The 4th International Workshop on spoken Language Technologies for Under-resourced Languages, 2014, Saint-Petersburg, Russia
Communication dans un congrès
hal-01433236v1
|
|
Développement et évaluation d’un système de traduction automatique de la parole en Pashto vers le FrançaisJEP 2014, 2014, Le Mans, France
Communication dans un congrès
hal-01433217v1
|
|
|
Segmentation et Regroupement en Locuteur pour le traitement incrémental des collections volumineuses30e Journées d’Études sur la Parole (JEP'14), 2014, Le Mans, France. pp.433 - 440
Communication dans un congrès
hal-01433245v1
|
Phonétisation automatique du dialecte tunisienJEP 2014, 2014, Le Mans, France
Communication dans un congrès
hal-01433231v1
|
|
|
LIUM and CRIM ASR System Combination for the REPERE Evaluation Campaign17th International Conference on Text, Speech and Dialogue, 2014, Brno, Czech Republic. pp.441 - 448, ⟨10.1007/978-3-319-10816-2_53⟩
Communication dans un congrès
hal-01450629v1
|
A Corpus and Phonetic Dictionary for Tunisian Arabic Speech RecognitionThe 9th edition of the Language Resources and Evaluation Conference (LREC 2014), 2014, Reykjavik, Iceland
Communication dans un congrès
hal-01433247v1
|
|
An investigation of single-pass ASR system combination for Spoken Language Understanding1st International Conference on Statistical Language and Speech Processing (SLSP 2013), 2013, Tarragona, Spain
Communication dans un congrès
hal-01433263v1
|
|
LIUM ASR system for ETAPE French evaluation campaign: experiments on system combination using open-source recognizersSixteenth International Conference on TEXT, SPEECH and DIALOGUE (TSD 2013), 2013, Pilsen, Czech Republic
Communication dans un congrès
hal-01450691v1
|
|
TED-LIUM: an Automatic Speech Recognition dedicated corpusProceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12), 2012, Istanbul, Turkey
Communication dans un congrès
hal-01434928v1
|
|
|
I-vectors and ILP clustering adapted to cross-show speaker diarizationInterspeech, 2012, Portland, Oregon (USA), United States
Communication dans un congrès
hal-01450711v1
|
Combinaison d’approches pour la reconnaissance du rôle des locuteursJEP 2012, 2012, Grenoble, France
Communication dans un congrès
hal-01450727v1
|
|
Low latency combination of parallelized single-pass LVCSR systemsInterspeech, Sep 2012, Portland, United States
Communication dans un congrès
hal-01313238v1
|
|
|
Segmentation et Regroupement en Locuteurs d'une collection de documents audio29e Journées d’Études sur la Parole (JEP'12), 2012, Grenoble, France. pp.433 - 440
Communication dans un congrès
hal-01450722v1
|
Avancées dans le domaine de la transcription automatique par décodage guidéJEP, 2012, Grenoble, France
Communication dans un congrès
hal-01433463v1
|
|
Robustesse et portabilités multilingue et multi-domaines des systèmes de compréhension de la parole : les corpus du projet PortMediaActes de la conférence conjointe JEP-TALN-RECITAL 2012, volume 1: JEP, 2012, Grenoble, France. pp.779--786
Communication dans un congrès
hal-01194257v1
|
|
|
Leveraging study of robustness and portability of spoken language understanding systems across languages and domains: the PORTMEDIA corporaThe International Conference on Language Resources and Evaluation, May 2012, Istanbul, Turkey
Communication dans un congrès
hal-00683433v1
|
LIA @ MediaEval 2011 : Compact Representation of Heterogeneous Descriptors for Video Genre ClassificationMediaEval, Sep 2011, Pise, Italy
Communication dans un congrès
hal-01320178v1
|
|
Investigation of Spontaneous Speech Characterization Applied to Speaker Role RecognitionInterspeech 2011, 2011, Firenze, Italy
Communication dans un congrès
hal-01433512v1
|
|
LIUM’s systems for the IWSLT 2011 Speech Translation TasksInternational Workshop on Spoken Language Translation, 2011, San Francisco (USA), Unknown Region
Communication dans un congrès
hal-01454949v1
|
|
Bag of n-gram driven decoding for LVCSR system harnessingAutomatic speech recognition and Understanding Workshop, 2011, Hawaï (USA), Unknown Region
Communication dans un congrès
hal-01434931v1
|
|
Automatic indexing of speech segments with spontaneity levels on large audio databaseACM Workshop on Searching Spontaneous Conversational Speech, 2010, Firenze, Italy
Communication dans un congrès
hal-01452962v1
|
|
The EPAC corpus: manual and automatic annotations of conversational speech in French broadcast newsLREC 2010, 2010, Unknown, Malta
Communication dans un congrès
hal-01433895v1
|
|
A Language-identification inspired method for spontaneous speech detectionINTERSPEECH, Sep 2010, Makuhari, Japan
Communication dans un congrès
hal-01320176v1
|
|
LIUM's Statistical Machine Translation System for IWSLT 2010International Workshop on Spoken Language Translation (IWSLT) 2010, 2010, Paris, France
Communication dans un congrès
hal-01450806v1
|
|
|
Reconnaissance Automatique de Locuteurs à l'aide de Fonctions de Croyance17e congrès francophone Reconnaissance des Formes et Intelligence Artificielle (RFIA'10), 2010, Caen, France
Communication dans un congrès
hal-01433893v1
|
|
Automatic named identification of speakers using belief functionsInformation Processing and Management of Uncertainty (IPMU'10), 2010, Dortmund, Germany
Communication dans un congrès
hal-01433886v1
|
Some recent research work at LIUM based on the use of CMU SphinxCMU SPUD Workshop, 2010, Dallas (Texas), Unknown Region
Communication dans un congrès
hal-01434933v1
|
|
Utilisation conjointe de modèles locaux et globaux pour la caractérisation et la détection de segments de parole spontanéeJEP 2010, 2010, Mons, Belgium
Communication dans un congrès
hal-01433896v1
|
|
Unsupervised model adaptation on targeted speech segments for LVCSR system combinationInterspeech 2010, 2010, Makuhari, Japan
Communication dans un congrès
hal-01433900v1
|
|
Corrections spécifiques du français sur les systèmes de reconnaissance automatique de la paroleRJCP 2009, 2009, Avignon, France
Communication dans un congrès
hal-01433948v1
|
|
Local and global models for spontaneous speech segment detection and characterizationIEEE ASRU 2009, 2009, Merano, Italy
Communication dans un congrès
hal-01433914v1
|
|
Spontaneous Speech Characterization and Detection in Large Audio Database13-th International Conference on Speech and Computer (SPECOM 2009), 2009, St Petersburg, Russia
Communication dans un congrès
hal-01433943v1
|
|
Improvements to the LIUM French ASR system based on CMU Sphinx: what helps to significantly reduce the word error rate?Interspeech 2009, 2009, Brighton, United Kingdom
Communication dans un congrès
hal-01450910v1
|
|
Iterative filtering of phonetic transcriptions of proper nounsIEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2009), 2009, Taipei, Taiwan. pp.4265--4268
Communication dans un congrès
hal-01433945v1
|
|
LIUM's Statistical Machine Translation Systems for IWSLT 2009International Workshop on Spoken Language Translation (IWSLT'09), 2009, Tokyo, Japan. pp.65--70
Communication dans un congrès
hal-01433932v1
|
|
Automatic named identification of speakers using diarization and asr systemsIEEE International conference on Acoustics, Speech and Signal Processing, Apr 2009, Taïpei, Taiwan. pp.10
Communication dans un congrès
hal-00412431v1
|
|
Manual vs assisted transcription of prepared and spontaneous speechLREC 2008, 2008, Marrakech, Morocco
Communication dans un congrès
hal-01433962v1
|
|
|
Etude pour l’amélioration d’un système d’identification nommée du locuteurJournées d'Etude de la Parole, Jun 2008, Avignon, France. pp.10
Communication dans un congrès
hal-00412340v1
|
The LIUM Arabic/English Statistical Machine Translation System for IWSLT 2008International Workshop on Spoken Language Translation, 2008, Unknown, Unknown Region. pp.63--68
Communication dans un congrès
hal-01434029v1
|
|
Transcription manuelle vs assistée de la parole préparée et spontanéeJEP 2008, 2008, Avignon, France
Communication dans un congrès
hal-01450913v1
|
|
|
Combinaison de systèmes pour la phonétisation automatique de noms propresXXVIIe Journées d'étude sur la parole (JEP 2008), Jun 2008, Avignon, France. pp.4
Communication dans un congrès
hal-01450912v1
|
Correcting ASR outputs: specific solutions to specific errors in FrenchIEEE Workshop on Spoken Language Technology (SLT 2008), 2008, Goa, India
Communication dans un congrès
hal-01434038v1
|
|
Data Selection and Smoothing in an Open-Source System for the 2008 NIST Machine Translation EvaluationInterspeech, 2008, Unknown, Unknown Region. pp.2727--2730
Communication dans un congrès
hal-01434055v1
|
|
|
Combined systems for automatic phonetic transcription of proper nounsLREC-2008, May 2008, Marrakech, Morocco
Communication dans un congrès
hal-01502832v1
|
|
Combinaison de systèmes par décodage guidéJEP / TALN / RECITAL 2008, Jun 2008, Avignon, France
Communication dans un congrès
hal-01318091v1
|
Caractérisation et détection de parole spontanée dans de larges collections de documents audioJEP, Jun 2008, Avignon, France
Communication dans un congrès
hal-01317613v1
|
|
Le codage des corpus orauxCatcod 2008, 2008, Orléans, France
Communication dans un congrès
hal-01450911v1
|
|
|
Combined systems for automatic phonetic transcription of proper nouns6th Language Evaluation and Resources Conference (LREC 2008), May 2008, Marrakech, Morocco. pp.1791-1795
Communication dans un congrès
hal-01433960v1
|
|
Generalized Driven Decoding for Speech Recognition System CombinationIEEE International Conference on Acoustics, Speech and Signal Processing, Mar 2008, Las Vegas, United States
Communication dans un congrès
hal-01318069v1
|
|
Extracting true speaker identities from transcriptionsInterspeech 2007, 2007, Antwerp, Belgium
Communication dans un congrès
hal-01434096v1
|
|
System Combination by Driven Decoding32nd International Conference on Acoustics, Speech and Signal Processing - ICASSP 2007, IEEE, Apr 2007, Honolulu, United States. pp.IV-341--IV-344, ⟨10.1109/ICASSP.2007.366919⟩
Communication dans un congrès
hal-01318073v1
|
Automatic detection of well recognized words in automatic speech transcriptionLREC 2006, 2006, Genoa, Italy
Communication dans un congrès
hal-01434123v1
|
|
Probabilité a posteriori : amélioration d'une mesure de confiance en reconnaissance de la paroleJEP'06, 2006, Dinard, France
Communication dans un congrès
hal-01434225v1
|
|
|
Indexation en locuteur : utilisation d'informations lexicalesLes Journées d'Étude sur la Parole (JEP) 2006, 2006, Dinard, France. pp.5
Communication dans un congrès
hal-01434240v1
|
|
Speaker diarization: about whom the speaker is talking?IEEE Speaker Odyssey 2006, 2006, San Juan Puerto Rico
Communication dans un congrès
hal-01434121v1
|
|
The LIUM speech transcription system: a CMU Sphinx III-based system for french broadcast news 9th European Conference on Speech Communication and Technology (Interspeech 2005), Sep 2005, Lisbonne, Portugal
Communication dans un congrès
hal-01434282v1
|
Automatic learning of interpretatation strategies for spoken dialogue systemsICASSP 2004, 2004, Montréal, Canada
Communication dans un congrès
hal-01434523v1
|
|
Conceptual decoding for spoken dialog systemsEurospeech 2003, 2003, Genêve, Switzerland. pp.3033--3336
Communication dans un congrès
hal-01434559v1
|
|
Belief confirmation in spoken dialog systems using confidence measuresASRU 2003, 2003, St Thomas, US Virgin Islands (USA), Unknown Region
Communication dans un congrès
hal-01434556v1
|
|
On the use of structures in language models for dialogue, Specific solutions for specific problemsISCA TRW on Multi-modal dialogue in mobile environments, 2002, Kloster Irsee, Germany
Communication dans un congrès
hal-01434607v1
|
|
On the use of structures in language models for dialogueICSLP 2002, 2002, Denver, Colorado (USA), Unknown Region. pp.929--932
Communication dans un congrès
hal-01434618v1
|
|
Modèles de langage hiérarchiques pour les applications de dialogue en parole spontanéeTALN 2001, 2001, Tours, France. pp.327--332
Communication dans un congrès
hal-01434626v1
|
|
Stochastic finite state automata triggered by dialogue statesEurospeech 2001, 2001, Aalborg, Denmark. pp.725--728
Communication dans un congrès
hal-01434645v1
|
|
Tree-based language model dedicated to natural spoken dialogs systemsISCA TRW on Adaptation methods for speech recognition, 2001, Sophia-Antipolis, France
Communication dans un congrès
hal-01434642v1
|
|
Dynamic selection of language models in a dialog systemICSLP 2000, 2000, Pékin Beijing, China. pp.214--217
Communication dans un congrès
hal-01434686v1
|
|
Sélection dynamique de modèles de langage dans une application de dialogueJEP 2000, 2000, Aussois, France. pp.185--188
Communication dans un congrès
hal-01434683v1
|
|
A language model combining n-grams and stochastic finite state automataEurospeech 1999, 1999, Budapest, Hungary. pp.2175--2178
Communication dans un congrès
hal-01434731v1
|
|
GENERALIZED DRIVEN DECODING FOR SPEECH RECOGNITION SYSTEM COMBINATIONICASSP, 2008, Las Vegas, United States
Poster de conférence
hal-02094742v1
|
Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 3 : DémonstrationsEstève, Yannick and Jiménez, Tania and Parcollet, Titouan and Zanon Boito, Marcely. ATALA, 2022
Ouvrages
hal-03705848v1
|
|
Statistical Language and Speech Processing, 5th International Conference, SLSP 2017Ouvrages hal-02408468v1 |
Adaptation and Discriminative Training of Acoustic ModelsTuomas Virtanen and Rita Singh and Bhiksha Raj. Techniques for Noise Robustness in Automatic Speech Recognition, Wiley, 2012
Chapitre d'ouvrage
hal-01433458v1
|
|
OLISIA: a Cascade System for Spoken Dialogue State Tracking2023
Pré-publication, Document de travail
hal-04072601v2
|
|
Is one brick enough to break the wall of spoken dialogue state tracking?2023
Pré-publication, Document de travail
hal-04267804v2
|
|
Exploring Gaussian mixture model framework for speaker adaptation of deep neural network acoustic models2020
Pré-publication, Document de travail
hal-02551714v1
|