Accéder directement au contenu

Matthieu GEIST

138
Documents

Publications

Image document

A FastSLAM Approach Integrating Beamforming Maps for Ultrasound-based Robotic Inspection of Metal Structures

Othmane-Latif Ouabi , Pascal Pomarede , Matthieu Geist , Nico F Declercq , Cedric Pradalier
IEEE Robotics and Automation Letters, 2021
Article dans une revue hal-03017841v3

Human Annotated Dialogues Dataset for Natural Conversational Agents

Erinc Merdivan , Deepika Singh , Sten Hanke , Johannes Kropf , Andreas Holzinger
Applied Sciences, 2020, 10 (3), pp.762. ⟨10.3390/app10030762⟩
Article dans une revue hal-03081727v1
Image document

Bridging the Gap Between Imitation Learning and Inverse Reinforcement Learning

Bilal Piot , Matthieu Geist , Olivier Pietquin
IEEE Transactions on Neural Networks and Learning Systems, 2017, 28 (8), pp.1814 - 1826. ⟨10.1109/TNNLS.2016.2543000⟩
Article dans une revue hal-01629654v1
Image document

Recherche locale de politique dans un espace convexe

Bruno Scherrer , Matthieu Geist
Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, 2015, 29 (6), pp.685-704. ⟨10.3166/RIA.29.685-706⟩
Article dans une revue hal-01275247v1
Image document

Approximate modified policy iteration and its application to the game of Tetris

Bruno Scherrer , Mohammad Ghavamzadeh , Victor Gabillon , Boris Lesner , Matthieu Geist
Journal of Machine Learning Research, 2015, 16, pp.1629−1676
Article dans une revue hal-01091341v1
Image document

Soft-max boosting

Matthieu Geist
Machine Learning, 2015, 100 (2), pp.305-332. ⟨10.1007/s10994-015-5491-2⟩
Article dans une revue hal-01258816v1
Image document

Off-policy Learning with Eligibility Traces: A Survey

Matthieu Geist , Bruno Scherrer
Journal of Machine Learning Research, 2014, 15 (1), pp.289-333
Article dans une revue hal-00921275v1
Image document

A C++ Template-Based Reinforcement Learning Library: Fitting the Code to the Mathematics

Hervé Frezza-Buet , Matthieu Geist
Journal of Machine Learning Research, 2013, 14 (1), pp.625-628
Article dans une revue hal-00914768v1
Image document

An algorithmic Survey of Parametric Value Function Approximation

Matthieu Geist , Olivier Pietquin
IEEE Transactions on Neural Networks and Learning Systems, 2013, 24 (6), pp.845-867. ⟨10.1109/TNNLS.2013.2247418⟩
Article dans une revue hal-00869725v1

Classification structurée pour l'apprentissage par renforcement inverse

Edouard Klein , Bilal Piot , Matthieu Geist , Olivier Pietquin
Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, 2013, 27 (2), pp.155-169. ⟨10.3166/ria.27.155-169⟩
Article dans une revue hal-00869723v1

A Comprehensive Reinforcement Learning Framework for Dialogue Management Optimisation

Lucie Daubigney , Matthieu Geist , Senthilkumar Chandramohan , Olivier Pietquin
IEEE Journal of Selected Topics in Signal Processing, 2012, 6 (8), pp.891-902. ⟨10.1109/JSTSP.2012.2229257⟩
Article dans une revue hal-00771646v1

Sample-Efficient Batch Reinforcement Learning for Dialogue Management Optimization

Olivier Pietquin , Matthieu Geist , Senthilkumar Chandramohan , Hervé Frezza-Buet
ACM - Transactions on Speech and Language Processing, 2011, 7 (3), pp.art. 7 (1-21). ⟨10.1145/1966407.1966412⟩
Article dans une revue hal-00617517v1

Différences temporelles de Kalman: Cas déterministe

Matthieu Geist , Olivier Pietquin , Gabriel Fricout
Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, 2010, 24 (4), pp.423-443. ⟨10.3166/ria.24.423-443⟩
Article dans une revue hal-00512093v1

Kalman Temporal Differences

Matthieu Geist , Olivier Pietquin
Journal of Artificial Intelligence Research, 2010, 39, pp.483-532
Article dans une revue hal-00858687v1
Image document

From Supervised to Reinforcement Learning: a Kernel-based Bayesian Filtering Framework

Matthieu Geist , Olivier Pietquin , Gabriel Fricout
International Journal On Advances in Software, 2009, 2 (1), pp.101-116
Article dans une revue hal-00429891v1

Localisation, Cartographie et Calibration de la Dispersion pour l'Inspection Robotique de Structures en Métal par Ondes Guidées

Othmane Ouabi , Pascal Pomarède , Nico Declercq , Neil Zeghidour , Matthieu Geist
16ème Congrès Français d'Acoustique, CFA2022, Société Française d'Acoustique; Laboratoire de Mécanique et d'Acoustique, Apr 2022, Marseille, France
Communication dans un congrès hal-03848450v1
Image document

Show me the Way: Intrinsic Motivation from Demonstrations

Léonard Hussenot , Robert Dadashi , Matthieu Geist , Olivier Pietquin
AAMAS 2021 - 20th International Conference on Autonomous Agents and Multiagent Systems, May 2021, Virtual, United Kingdom
Communication dans un congrès hal-03162139v1
Image document

Primal Wasserstein Imitation Learning

Robert Dadashi , Léonard Hussenot , Matthieu Geist , Olivier Pietquin
ICLR 2021 - Ninth International Conference on Learning Representations, May 2021, Vienna / Virtual, Austria
Communication dans un congrès hal-03162526v1
Image document

What Matters In On-Policy Reinforcement Learning? A Large-Scale Empirical Study

Marcin Andrychowicz , Anton Raichuk , Piotr Stańczyk , Manu Orsini , Sertan Girgin
ICLR 2021 - Ninth International Conference on Learning Representations, May 2021, Vienna / Virtual, Austria
Communication dans un congrès hal-03162554v1
Image document

Adversarially Guided Actor-Critic

Yannis Flet-Berliac , Johan Ferret , Olivier Pietquin , Philippe Preux , Matthieu Geist
ICLR 2021 - International Conference on Learning Representations, May 2021, Vienna / Virtual, Austria
Communication dans un congrès hal-03167169v1
Image document

CopyCAT: Taking Control of Neural Policies with Constant Attacks

Léonard Hussenot , Matthieu Geist , Olivier Pietquin
AAMAS 2020 - 19th International Conference on Autonomous Agents and Multi-Agent Systems, May 2020, Virtual, New Zealand
Communication dans un congrès hal-03162124v1
Image document

Self-Attentional Credit Assignment for Transfer in Reinforcement Learning

Johan Ferret , Raphaël Marinier , Matthieu Geist , Olivier Pietquin
IJCAI 2020 - 29th International Joint Conference on Artificial Intelligence, Jul 2020, Yokohama / Virtual, Japan
Communication dans un congrès hal-03159832v1
Image document

Monte-Carlo Localization on Metal Plates Based on Ultrasonic Guided Waves

Othmane-Latif Ouabi , Pascal Pomarede , Matthieu Geist , Nico Felicien Declercq , Cedric Pradalier
International Symposium on Experimental Robotics, Nov 2020, Malte, Malta
Communication dans un congrès hal-03120508v1

Image-Based Place Recognition on Bucolic Environment Across Seasons From Semantic Edge Description

Assia Benbihi , Stéphanie Aravecchia , Matthieu Geist , Cedric Pradalier
2020 IEEE International Conference on Robotics and Automation (ICRA), May 2020, Paris, France. pp.3032-3038, ⟨10.1109/ICRA40945.2020.9197529⟩
Communication dans un congrès hal-03157977v1

Modified Actor-Critics

Erinc Merdivan , Sten Hanke , Matthieu Geist
AAMAS2020 - International Conference on Autonomous Agents and MultiAgent Systems, May 2020, virtual, New Zealand
Communication dans un congrès hal-03081704v1
Image document

Momentum in Reinforcement Learning

Nino Vieillard , Bruno Scherrer , Olivier Pietquin , Matthieu Geist
AISTATS 2020 - 23rd International Conference on Artificial Intelligence and Statistics, Aug 2020, Palermo / Virtual, Italy
Communication dans un congrès hal-03137343v1

A Theory of Regularized Markov Decision Processes

Matthieu Geist , Bruno Scherrer , Olivier Pietquin
ICML 2019 - Thirty-sixth International Conference on Machine Learning, Jun 2019, Long Island, United States
Communication dans un congrès hal-02273741v1
Image document

Importance Sampling for Deep System Identification

Antoine Mahé , Antoine Richard , Benjamin Mouscadet , Cedric Pradalier , Matthieu Geist
19th International Conference on Advanced Robotics (ICAR), 2019, Belo Horizonte, Brazil. ⟨10.1109/ICAR46387.2019.8981590⟩
Communication dans un congrès hal-02278171v1

Image-Based Text Classification using 2D Convolutional Neural Networks

Erinc Merdivan , Anastasios Vafeiadis , Dimitrios Kalatzis , Sten Hanke , Joahannes Kroph
2019 IEEE SmartWorld, Ubiquitous Intelligence & Computing, Advanced & Trusted Computing, Scalable Computing & Communications, Cloud & Big Data Computing, Internet of People and Smart City Innovation (SmartWorld/SCALCOM/UIC/ATC/CBDCom/IOP/SCI), Aug 2019, Leicester, United Kingdom. pp.144-149, ⟨10.1109/SmartWorld-UIC-ATC-SCALCOM-IOP-SCI.2019.00066⟩
Communication dans un congrès hal-03081713v1
Image document

Trajectory-control using deep system identification and model predictive control for drone control under uncertain load

Antoine Mahé , Cédric Pradalier , Matthieu Geist
2018 22nd International Conference on System Theory, Control and Computing (ICSTCC), Oct 2018, Sinaia, Romania. ⟨10.1109/ICSTCC.2018.8540719⟩
Communication dans un congrès hal-01927035v1

A Deep Learning Approach for Privacy Preservation in Assisted Living

Ismini Psychoula , Erinc Merdivan , Deepika Singh , Liming Chen , Feng Chen
2018 IEEE International Conference on Pervasive Computing and Communications Workshops (PerCom Workshops), Mar 2018, Athens, Greece. pp.710-715, ⟨10.1109/PERCOMW.2018.8480247⟩
Communication dans un congrès hal-03081669v1
Image document

Anderson acceleration for reinforcement learning

Matthieu Geist , Bruno Scherrer
EWRL 2018 - 4th European workshop on Reinforcement Learning, Oct 2018, Lille, France
Communication dans un congrès hal-01928142v1
Image document

Is the Bellman residual a bad proxy?

Matthieu Geist , Bilal Piot , Olivier Pietquin
NIPS 2017 - Advances in Neural Information Processing Systems, Dec 2017, Long Beach, United States. pp.1-13
Communication dans un congrès hal-01629739v1
Image document

Real time degradation identification of UAV using machine learning techniques

Anush Manukyan , Olivares-Mendez Miguel , Holger Voos , Matthieu Geist
International Conference on Unmanned Aircraft Systems (ICUAS), 2017, Miami, United States
Communication dans un congrès hal-01629680v1

Faut-il minimiser le résidu de Bellman ou maximiser la valeur moyenne ?

Matthieu Geist , Bilal Piot , Olivier Pietquin
Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes (JFPDA 2017), Jul 2017, Caen, France
Communication dans un congrès hal-01576347v1
Image document

Reconstruct & Crush Network

Erinc Merdivan , Mohammad Reza Loghmani , Matthieu Geist
Advances in Neural Information Processing Systems, 2017, Long Beach, United States
Communication dans un congrès hal-01629742v1
Image document

Human activity recognition using recurrent neural networks

Deepika Singh , Erinc Merdivan , Ismini Psychoula , Johannes Kropf , Sten Hanke
1st International Cross-Domain Conference for Machine Learning and Knowledge Extraction (CD-MAKE), Aug 2017, Reggio, Italy. pp.267-274, ⟨10.1007/978-3-319-66808-6_18⟩
Communication dans un congrès hal-01629704v1
Image document

Softened approximate policy iteration for Markov games

Julien Pérolat , Bilal Piot , Matthieu Geist , Bruno Scherrer , Olivier Pietquin
ICML 2016 - 33rd International Conference on Machine Learning, Jun 2016, New York City, United States
Communication dans un congrès hal-01393328v1
Image document

Score-based Inverse Reinforcement Learning

Layla El Asri , Bilal Piot , Matthieu Geist , Romain Laroche , Olivier Pietquin
International Conference on Autonomous Agents and Multiagent Systems (AAMAS 2016), May 2016, Singapore, Singapore
Communication dans un congrès hal-01406886v1
Image document

Batch Policy Iteration Algorithms for Continuous Domains

Bilal Piot , Matthieu Geist , Olivier Pietquin
European Workshop on Reinforcement Learning (EWRL), 2016, Barcelone, Spain
Communication dans un congrès hal-01629651v1
Image document

A multiplicative UCB strategy for Gamma rewards

Matthieu Geist
European Workshop on Reinforcement Learning, 2015, Lille, France
Communication dans un congrès hal-01258820v1
Image document

Imitation Learning Applied to Embodied Conversational Agents

Bilal Piot , Matthieu Geist , Olivier Pietquin
4th Workshop on Machine Learning for Interactive Systems (MLIS 2015), Jul 2015, Lille, France
Communication dans un congrès hal-01225816v1
Image document

Inverse Reinforcement Learning in Relational Domains

Thibaut Munzer , Bilal Piot , Matthieu Geist , Olivier Pietquin , Manuel Lopes
International Joint Conferences on Artificial Intelligence, Jul 2015, Buenos Aires, Argentina
Communication dans un congrès hal-01154650v1
Image document

Local Policy Search in a Convex Space and Conservative Policy Iteration as Boosted Policy Search

Bruno Scherrer , Matthieu Geist
ECMLPKDD 2014, Sep 2014, Nancy, France. pp.35 - 50, ⟨10.1007/978-3-662-44845-8_3⟩
Communication dans un congrès hal-01086345v1

Méthode de minimisation du résidu de Bellman boostée qui tient compte des démonstrations expertes.

Bilal Piot , Matthieu Geist , Olivier Pietquin
9èmes Journées Francophones de Planification, Décision et Apprentissage (JFPDA'14), May 2014, Liège, Belgique
Communication dans un congrès hal-01104789v1
Image document

Predicting when to laugh with structured classification

Bilal Piot , Olivier Pietquin , Matthieu Geist
InterSpeech 2014, Sep 2014, Singapore, Singapore. pp.1786-1790
Communication dans un congrès hal-01104739v1
Image document

Boosted Bellman Residual Minimization Handling Expert Demonstrations

Bilal Piot , Matthieu Geist , Olivier Pietquin
European Conference, ECML PKDD 2014, Sep 2014, Nancy, France. pp.549-564, ⟨10.1007/978-3-662-44851-9_35⟩
Communication dans un congrès hal-01060953v1
Image document

Difference of Convex Functions Programming for Reinforcement Learning

Bilal Piot , Matthieu Geist , Olivier Pietquin
Advances in Neural Information Processing Systems (NIPS 2014), Dec 2014, Montreal, Canada
Communication dans un congrès hal-01104419v1

Boosted and Reward-regularized Classification for Apprenticeship Learning

Bilal Piot , Matthieu Geist , Olivier Pietquin
AAMAS 2014 : 13th International Conference on Autonomous Agents and Multiagent Systems, May 2014, Paris, France. pp.1249-1256
Communication dans un congrès hal-01107837v1
Image document

Local Policy Search in a Convex Space and Conservative Policy Iteration as Boosted Policy Search

Bruno Scherrer , Matthieu Geist
ECML, Sep 2014, Nancy, France. pp.35 - 50, ⟨10.1007/978-3-662-44845-8_3⟩
Communication dans un congrès hal-01091079v1

Quand l'optimalité locale implique une garantie globale : recherche locale de politique dans un espace convexe et algorithme d'itération sur les politiques conservatif vu comme une montée de gradient fonctionnel

Bruno Scherrer , Matthieu Geist
9èmes Journées Francophones de Planification, Décision et Apprentissage (JFPDA'14), May 2014, Liège, Belgique
Communication dans un congrès hal-01104776v1

Laugh-aware virtual agent and its impact on user amusement

Radoslaw Niewiadomski , Jennifer Hofmann , Jérôme Urbain , Tracey Platt , Johannes Wagner
AAMAS '13, May 2013, Saint Paul, Minnesota, United States. pp.619-626
Communication dans un congrès hal-00869751v1

Learning from demonstrations: Is it worth estimating a reward function?

Bilal Piot , Matthieu Geist , Olivier Pietquin
1st Multidisciplinary Conference on Reinforcement Learning and Decision Making (RLDM 2013), Oct 2013, Princeton, New Jersey, United States
Communication dans un congrès hal-00916938v1
Image document

Classification régularisée par la récompense pour l'Apprentissage par Imitation

Bilal Piot , Matthieu Geist , Olivier Pietquin
Journées Francophones de Plannification, Décision et Apprentissage (JFPDA), Jul 2013, Lille, France
Communication dans un congrès hal-00916940v1

Apprentissage par renforcement inverse en cascadant classification et régression

Edouard Klein , Bilal Piot , Matthieu Geist , Olivier Pietquin
Journées Francophones de Plannification, Décision et Apprentissage (JFPDA), Jul 2013, Lille, France
Communication dans un congrès hal-00916942v1

Around Inverse Reinforcement Learning and Score-based Classification

Matthieu Geist , Edouard Klein , Bilal Piot , Yann Guermeur , Olivier Pietquin
1st Multidisciplinary Conference on Reinforcement Learning and Decision Making (RLDM 2013), Oct 2013, Princeton, New Jersey, United States
Communication dans un congrès hal-00916936v1
Image document

Learning from Demonstrations: Is It Worth Estimating a Reward Function?

Bilal Piot , Matthieu Geist , Olivier Pietquin
Joint European Conference on Machine Learning and Knowledge Discovery in Databases (ECML/PKDD 2013), Sep 2013, Prague, Czech Republic. pp.17-32, ⟨10.1007/978-3-642-40988-2_2⟩
Communication dans un congrès hal-00869801v1
Image document

Apprentissage par démonstrations : vaut-il la peine d'estimer une fonction de récompense?

Bilal Piot , Matthieu Geist , Olivier Pietquin
Journées Francophones de Plannification, Décision et Apprentissage (JFPDA), Jul 2013, Lille, France
Communication dans un congrès hal-00916941v1

Optimisation par essaims particulaires de stratégies de dialogue

Lucie Daubigney , Matthieu Geist , Olivier Pietquin
Journées Francophones de Plannification, Décision et Apprentissage (JFPDA), Jul 2013, Lille, France
Communication dans un congrès hal-00918425v1

Model-free POMDP optimisation of tutoring systems with echo-state networks

Lucie Daubigney , Matthieu Geist , Olivier Pietquin
SIGDial 2013, Aug 2013, Metz, France. pp.102-106
Communication dans un congrès hal-00869773v1
Image document

A cascaded supervised learning approach to inverse reinforcement learning

Edouard Klein , Bilal Piot , Matthieu Geist , Olivier Pietquin
Joint European Conference on Machine Learning and Knowledge Discovery in Databases (ECML/PKDD 2013), Sep 2013, Prague, Czech Republic. pp.1-16, ⟨10.1007/978-3-642-40988-2_1⟩
Communication dans un congrès hal-00869804v1
Image document

Random Projections: a Remedy for Overfitting Issues in Time Series Prediction with Echo State Networks

Lucie Daubigney , Matthieu Geist , Olivier Pietquin
ICASSP 2013, May 2013, Vancouver, Canada. pp.3253-3257, ⟨10.1109/ICASSP.2013.6638259⟩
Communication dans un congrès hal-00869814v1
Image document

Particle Swarm Optimisation of Spoken Dialogue System Strategies

Lucie Daubigney , Matthieu Geist , Olivier Pietquin
Interspeech 2013, Aug 2013, Lyon, France. pp.1-5
Communication dans un congrès hal-00916935v1
Image document

Classification structurée pour l'apprentissage par renforcement inverse

Edouard Klein , Bilal Piot , Matthieu Geist , Olivier Pietquin
Conférence Francophone sur l'Apprentissage Automatique - CAp 2012, May 2012, Nancy, France. pp.1-16
Communication dans un congrès hal-00701947v1

Approximations de l'Algorithme Itérations sur les Politiques Modifié

Bruno Scherrer , Victor Gabillon , Mohammad Ghavamzadeh , Matthieu Geist
Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 1 p
Communication dans un congrès hal-00736226v1

Structured Classification for Inverse Reinforcement Learning

Edouard Klein , Bilal Piot , Matthieu Geist , Olivier Pietquin
EWRL 2012, Jun 2012, Edinburgh, United Kingdom. pp.1-14
Communication dans un congrès hal-00749524v1
Image document

Monte-Carlo Swarm Policy Search

Jérémy Fix , Matthieu Geist
Symposium on Swarm Intelligence and Differential Evolution, Apr 2012, Zakopane, Poland. pp.75-83, ⟨10.1007/978-3-642-29353-5_9⟩
Communication dans un congrès hal-00695540v1

Co-adaptation in Spoken Dialogue Systems

Senthilkumar Chandramohan , Matthieu Geist , Fabrice Lefèvre , Olivier Pietquin
IWSDS 2012, Nov 2012, Paris, France. pp.1
Communication dans un congrès hal-00778752v1
Image document

Clustering Behaviors Of Spoken Dialogue Systems Users

Senthilkumar Chandramohan , Matthieu Geist , Fabrice Lefèvre , Olivier Pietquin
ICASSP 2012, Mar 2012, Kyoto, Japan. pp.4981-4984
Communication dans un congrès hal-00685009v1
Image document

Inverse Reinforcement Learning through Structured Classification

Edouard Klein , Matthieu Geist , Bilal Piot , Olivier Pietquin
NIPS 2012, Dec 2012, Lake Tahoe, Nevada, United States. pp.1-9
Communication dans un congrès hal-00778624v1
Image document

Optimisation de contrôleurs par essaim particulaire

Jérémy Fix , Matthieu Geist
Conférence Francophone sur l'Apprentissage Automatique - CAp 2012, May 2012, Nancy, France. pp.1-14
Communication dans un congrès hal-00701945v1

Optimisation d'un tuteur intelligent à partir d'un jeu de données fixé

Lucie Daubigney , Matthieu Geist , Olivier Pietquin
JEP 2012, Jun 2012, Grenoble, France. pp.241-248
Communication dans un congrès hal-00749498v1
Image document

Off-policy Learning in Large-scale POMDP-based Dialogue Systems

Lucie Daubigney , Matthieu Geist , Olivier Pietquin
ICASSP 2012, Mar 2012, Kyoto, Japan. pp.4989-4992
Communication dans un congrès hal-00684819v1

Filtering of pathological ventricular rhythms during MRI scanning

Julien Oster , Matthieu Geist , Olivier Pietquin , Gary D. Clifford
BSI2012, Jul 2012, Como, Italy. pp.97-100
Communication dans un congrès hal-00749457v1

A Dantzig Selector Approach to Temporal Difference Learning

Matthieu Geist , Bruno Scherrer , Alessandro Lazaric , Mohammad Ghavamzadeh
ICML-12, Jun 2012, Edinburgh, United Kingdom. pp.1399-1406
Communication dans un congrès hal-00749480v1
Image document

Regroupement non-supervisé d'utilisateurs par leur comportement pour les systèmes de dialogue parlé

Senthilkumar Chandramohan , Matthieu Geist , Fabrice Lefèvre , Olivier Pietquin
Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 16 p
Communication dans un congrès hal-00736205v1

Behavior Specific User Simulation in Spoken Dialogue Systems

Senthilkumar Chandramohan , Matthieu Geist , Fabrice Lefèvre , Olivier Pietquin
10th ITG Conference on Speech Communication, Sep 2012, Braunschweig, Germany. pp.1-4
Communication dans un congrès hal-00749421v1
Image document

Apprentissage off-policy appliqué à un système de dialogue basé sur les PDMPO

Lucie Daubigney , Matthieu Geist , Olivier Pietquin
RFIA 2012 (Reconnaissance des Formes et Intelligence Artificielle), Jan 2012, Lyon, France. pp.978-2-9539515-2-3
Communication dans un congrès hal-00656496v1
Image document

Approximate Modified Policy Iteration

Bruno Scherrer , Mohammad Ghavamzadeh , Victor Gabillon , Matthieu Geist
29th International Conference on Machine Learning - ICML 2012, Jun 2012, Edinburgh, United Kingdom
Communication dans un congrès hal-00758882v1
Image document

Un sélecteur de Dantzig pour l'apprentissage par différences temporelles

Matthieu Geist , Bruno Scherrer , Alessandro Lazaric , Mohammad Ghavamzadeh
Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 13 p
Communication dans un congrès hal-00736229v1
Image document

Gestion de l'incertitude pour l'optimisation en ligne d'un gestionnaire de dialogues parlés à grande échelle basé sur les POMDP

Lucie Daubigney , Senthilkumar Chandramohan , Matthieu Geist , Olivier Pietquin
JFPDA 2011, Jun 2011, Rouen, France. pp.1-7
Communication dans un congrès hal-00652511v1

Moindres carrés récursifs pour l'évaluation off-policy d'une politique avec traces d'éligibilité

Bruno Scherrer , Matthieu Geist
6ème Journées Francophones de Planification, Décision et Apprentissage pour la conduite de systèmes - JFPDA 2011, Jun 2011, Rouen, France
Communication dans un congrès hal-00644874v1

Kalman filtering & colored noises: the (autoregressive) moving-average case

Matthieu Geist , Olivier Pietquin
MLASA 2011, Dec 2011, Honolulu, United States. pp.1-4
Communication dans un congrès hal-00660607v1
Image document

Dynamic Neural Field Optimization using the Unscented Kalman Filter

Jérémy Fix , Matthieu Geist , Olivier Pietquin , Hervé Frezza-Buet
CCMB 2011, Apr 2011, Paris, France. 7 p., ⟨10.1109/CCMB.2011.5952113⟩
Communication dans un congrès hal-00618117v1

Batch, Off-policy and Model-free Apprenticeship Learning

Edouard Klein , Matthieu Geist , Olivier Pietquin
EWRL 2011, Sep 2011, Athens, Greece. pp.1-12
Communication dans un congrès hal-00660623v1

Batch, Off-policy and Model-Free Apprenticeship Learning

Edouard Klein , Matthieu Geist , Olivier Pietquin
IJCAI Workshop on Agents Learning Interactively from Human Teachers (ALIHT 2011), Jun 2011, Barcelona, Spain. 6 p
Communication dans un congrès hal-00596370v1
Image document

Sample Efficient On-line Learning of Optimal Dialogue Policies with Kalman Temporal Differences

Olivier Pietquin , Matthieu Geist , Senthilkumar Chandramohan
IJCAI 2011, Jul 2011, Barcelona, Spain. pp.1878-1883
Communication dans un congrès hal-00618252v1
Image document

Uncertainty management for on-line optimisation of a POMDP-based large-scale spoken dialogue system

Lucie Daubigney , Milica Gašić , Senthilkumar Chandramohan , Matthieu Geist , Olivier Pietquin
Interspeech 2011, Aug 2011, Florence, Italy. pp.1301-1304
Communication dans un congrès hal-00652194v1

Reducing the dimentionality of the reward space in the Inverse Reinforcement Learning problem

Edouard Klein , Matthieu Geist , Olivier Pietquin
MLASA 2011, Dec 2011, Honolulu, United States. pp.1-4
Communication dans un congrès hal-00660612v1
Image document

Apprentissage par imitation dans un cadre batch, off-policy et sans modèle

Edouard Klein , Matthieu Geist , Olivier Pietquin
JFPDA 2011, Jun 2011, Rouen, France. pp.1-9
Communication dans un congrès hal-00652762v1
Image document

Parametric value function approximation: A unified view

Matthieu Geist , Olivier Pietquin
ADPRL 2011, Apr 2011, Paris, France. pp.9-16, ⟨10.1109/ADPRL.2011.5967355⟩
Communication dans un congrès hal-00618112v1
Image document

Optimization of a Tutoring System from a Fixed Set of Data

Olivier Pietquin , Lucie Daubigney , Matthieu Geist
SLaTE 2011, Aug 2011, Venice, Italy. pp.1-4
Communication dans un congrès hal-00652324v1

Performance evaluation for particle filters

Remi Chou , Yvo Boers , Martin Podt , Matthieu Geist
FUSION 2011, Jul 2011, Chicago, United States. pp.1-7
Communication dans un congrès hal-00652168v1
Image document

Apprentissage par Renforcement Inverse pour la Simulation d'Utilisateurs dans les Systèmes de Dialogue

Senthilkumar Chandramohan , Matthieu Geist , Olivier Pietquin
JFPDA 2011, Jun 2011, Rouen, France. pp.1-7
Communication dans un congrès hal-00652753v1
Image document

A Non-Parametric Approach to Approximate Dynamic Programming

Hadrien Glaude , Fadi Akrimi , Matthieu Geist , Olivier Pietquin
ICMLA 2011, Dec 2011, Honolulu, Hawaii, United States. pp.1-6
Communication dans un congrès hal-00652438v1
Image document

User Simulation in Dialogue Systems using Inverse Reinforcement Learning

Senthilkumar Chandramohan , Matthieu Geist , Fabrice Lefèvre , Olivier Pietquin
Interspeech 2011, Aug 2011, Florence, Italy. pp.1025-1028
Communication dans un congrès hal-00652446v1
Image document

l1-penalized projected Bellman residual

Matthieu Geist , Bruno Scherrer
European Wrokshop on Reinforcement Learning (EWRL 11), Sep 2011, Athens, Greece
Communication dans un congrès hal-00644507v1
Image document

Recursive Least-Squares Learning with Eligibility Traces

Bruno Scherrer , Matthieu Geist
European Wrokshop on Reinforcement Learning (EWRL 11), Sep 2011, Athens, Greece
Communication dans un congrès hal-00644511v1
Image document

Apprentissage par renforcement pour la personnalisation d'un logiciel d'enseignement des langues

Lucie Daubigney , Matthieu Geist , Olivier Pietquin
EIAH 2011, May 2011, Mons, Belgique. pp.1-5
Communication dans un congrès hal-00652516v1

Revisiting natural actor-critics with value function approximation

Matthieu Geist , Olivier Pietquin
5èmes Journées Francophones de Planification, Décision et Apprentissage pour la conduite de systèmes (JFPDA'10), Jun 2010, Besançon, France
Communication dans un congrès hal-00554346v1

Managing Uncertainty within Value Function Approximation in Reinforcement Learning

Matthieu Geist , Olivier Pietquin
Active Learning and Experimental Design workshop (collocated with AISTATS 2010), May 2010, Sardinia, Italy
Communication dans un congrès hal-00554398v1

Statistical Linearization for Value Function Approximation in Reinforcement Learning

Matthieu Geist
NIPS Workshop on Learning and Planning from Batch Time Series Data (OPT 2010), Dec 2010, Vancouver, Canada. pp.1-6
Communication dans un congrès hal-00554324v1

Revisiting natural actor-critics with value function approximation

Matthieu Geist , Olivier Pietquin
BNAIC 2010, Oct 2010, Luxembourg, Luxembourg. 1 page
Communication dans un congrès hal-00553175v1

Sparse Approximate Dynamic Programming for Dialog Management

Senthilkumar Chandramohan , Matthieu Geist , Olivier Pietquin
SIGDial 2010, Sep 2010, Tokyo, Japan. pp.107-115
Communication dans un congrès hal-00553180v1

Statistically linearized least-squares temporal differences

Matthieu Geist , Olivier Pietquin
ICUMT 2010, Oct 2010, Moscow, Russia. pp.450-457, ⟨10.1109/ICUMT.2010.5676598⟩
Communication dans un congrès hal-00553913v1

Managing Uncertainty within the KTD Framework

Matthieu Geist , Olivier Pietquin
Active Learning and Experimental Design workshop in conjunction with AISTATS 2010, May 2010, Sardinia, Italy. pp.157-168
Communication dans un congrès hal-00599636v1

Revisiting Natural Actor-Critics with Value Function Approximation

Matthieu Geist , Olivier Pietquin
MDAI 2010, Oct 2010, Perpignan, France. pp.207-218, ⟨10.1007/978-3-642-16292-3_21⟩
Communication dans un congrès hal-00553870v1

Eligibility Traces through Colored Noises

Matthieu Geist , Olivier Pietquin
ICUMT 2010, Oct 2010, Moscow, Russia. pp.458-465, ⟨10.1109/ICUMT.2010.5676597⟩
Communication dans un congrès hal-00553910v1

Gestion de l'incertitude dans le cadre de l'approximation de la fonction de valeur pour l'apprentissage par renforcement

Matthieu Geist , Olivier Pietquin
CAP 2010, May 2010, Clermont-Ferrand, France. pp.101-112
Communication dans un congrès hal-00553895v1

Optimizing Spoken Dialogue Management with Fitted Value Iteration

Senthilkumar Chandramohan , Matthieu Geist , Olivier Pietquin
Interspeech 2010, Sep 2010, Makuhari, Japan. pp.86-89
Communication dans un congrès hal-00553184v1

Statistically Linearized Least-Squares Temporal Differences

Matthieu Geist , Olivier Pietquin
5èmes Journées Francophones de Planification, Décision et Apprentissage pour la conduite de systèmes (JFPDA'10), Jun 2010, Besançon, France
Communication dans un congrès hal-00554338v1

Astuce du Noyau & Quantification Vectorielle

Matthieu Geist , Olivier Pietquin , Gabriel Fricout
RFIA'10, Jan 2010, Caen, France. 8 p
Communication dans un congrès hal-00553114v1

Statistically Linearized Recursive Least Squares

Matthieu Geist , Olivier Pietquin
MLSP 2010, Aug 2010, Kittilä, Finland. pp.272-276, ⟨10.1109/MLSP.2010.5589236⟩
Communication dans un congrès hal-00553168v1
Image document

Différences Temporelles de Kalman : le cas stochastique

Matthieu Geist , Olivier Pietquin , Gabriel Fricout
JFPDA 2009, Jun 2009, Paris, France. (13 p.)
Communication dans un congrès hal-00437006v1

Tracking in Reinforcement Learning

Matthieu Geist , Olivier Pietquin , Gabriel Fricout
16th International Conference on Neural Information Processing - ICONIP 2009, Dec 2009, Bangkok, Thailand. pp.502-511, ⟨10.1007/978-3-642-10677-4_57⟩
Communication dans un congrès hal-00439316v1
Image document

Kalman Temporal Differences: the deterministic case

Matthieu Geist , Olivier Pietquin , Gabriel Fricout
ADPRL 2009, Mar 2009, Nashville, TN, United States. pp.185-192, ⟨10.1109/ADPRL.2009.4927543⟩
Communication dans un congrès hal-00380870v1
Image document

Kernelizing Vector Quantization Algorithms

Matthieu Geist , Olivier Pietquin , Gabriel Fricout
ESANN'2009, Apr 2009, Bruges, Belgium. pp.541-546
Communication dans un congrès hal-00429892v1
Image document

Différences Temporelles de Kalman

Matthieu Geist , Olivier Pietquin , Gabriel Fricout
JFPDA 2009, Jun 2009, Paris, France. (20 p.)
Communication dans un congrès hal-00437002v1

Bayesian Reward Filtering

Matthieu Geist , Olivier Pietquin
EWRL 2008, Jun 2008, Lille, France. pp.96-109, ⟨10.1007/978-3-540-89722-4_8⟩
Communication dans un congrès hal-00351282v1

Filtrage bayésien de la récompense

Matthieu Geist , Olivier Pietquin , Gabriel Fricout
JFPDA 2008, Jun 2008, Metz, France. pp.113-122
Communication dans un congrès hal-00351343v1
Image document

A Sparse Nonlinear Bayesian Online Kernel Regression

Matthieu Geist , Olivier Pietquin , Gabriel Fricout
AdvComp 2008, Oct 2008, Valencia, Spain. pp.199-204, ⟨10.1109/ADVCOMP.2008.7⟩
Communication dans un congrès hal-00327081v1
Image document

Online Bayesian Kernel Regression from Nonlinear Mapping of Observations

Matthieu Geist , Olivier Pietquin , Gabriel Fricout
MLSP 2008, Oct 2008, Cancun, Mexico. pp.309-314, ⟨10.1109/MLSP.2008.4685498⟩
Communication dans un congrès hal-00335052v1

Kalman Temporal Differences

Matthieu Geist
Cross-border workshop of PhD students in fundamental and applied mathematics (LMAM - UPVM), Dec 2008, Metz, France
Communication dans un congrès hal-00351297v1

Kalman Temporal Differences: Uncertainty and Value Function Approximation

Matthieu Geist , Olivier Pietquin , Gabriel Fricout
NIPS Workshop on Model Uncertainty and Risk in Reinforcement Learning, Dec 2008, Vancouver, Canada
Communication dans un congrès hal-00351298v1

Convolutional and Recurrent Neural Networks for Activity Recognition in Smart Environment

Deepika Singh , Erinc Merdivan , Sten Hanke , Johannes Kropf , Matthieu Geist
A. Holzinger; R. Goebel; M. Ferri; V. Palade. Towards Integrative Machine Learning and Knowledge Extraction, 10344, springer, pp.194-205, 2017, Lecture Notes in Computer Science
Chapitre d'ouvrage hal-01629732v1
Image document

Apprentissage off-policy appliqué à un système de dialogue basé sur les PDMPO

Lucie Daubigney , Matthieu Geist , Olivier Pietquin
Actes du 18ème congrès francophone sur la Reconnaissance de Formes et l'Intelligence Artificielle (RFIA 2012), 2012, pp.1-8
Autre publication scientifique hal-00656997v1
Image document

Contrôle optimal et apprentissage automatique, applications aux interactions homme-machine

Matthieu Geist
Machine Learning [stat.ML]. Université de Lille 1 - Sciences et Technologies, 2016
HDR tel-01629638v1