Matthieu GEIST

138

Documents

Publications

	A FastSLAM Approach Integrating Beamforming Maps for Ultrasound-based Robotic Inspection of Metal Structures Othmane-Latif Ouabi , Pascal Pomarede , Matthieu Geist , Nico F Declercq , Cedric Pradalier IEEE Robotics and Automation Letters, 2021 Article dans une revue hal-03017841v3
	Human Annotated Dialogues Dataset for Natural Conversational Agents Erinc Merdivan , Deepika Singh , Sten Hanke , Johannes Kropf , Andreas Holzinger Applied Sciences, 2020, 10 (3), pp.762. ⟨10.3390/app10030762⟩ Article dans une revue hal-03081727v1
	Bridging the Gap Between Imitation Learning and Inverse Reinforcement Learning Bilal Piot , Matthieu Geist , Olivier Pietquin IEEE Transactions on Neural Networks and Learning Systems, 2017, 28 (8), pp.1814 - 1826. ⟨10.1109/TNNLS.2016.2543000⟩ Article dans une revue hal-01629654v1
	Approximate modified policy iteration and its application to the game of Tetris Bruno Scherrer , Mohammad Ghavamzadeh , Victor Gabillon , Boris Lesner , Matthieu Geist Journal of Machine Learning Research, 2015, 16, pp.1629−1676 Article dans une revue hal-01091341v1
	Soft-max boosting Matthieu Geist Machine Learning, 2015, 100 (2), pp.305-332. ⟨10.1007/s10994-015-5491-2⟩ Article dans une revue hal-01258816v1
	Recherche locale de politique dans un espace convexe Bruno Scherrer , Matthieu Geist Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, 2015, 29 (6), pp.685-704. ⟨10.3166/RIA.29.685-706⟩ Article dans une revue hal-01275247v1
	Off-policy Learning with Eligibility Traces: A Survey Matthieu Geist , Bruno Scherrer Journal of Machine Learning Research, 2014, 15 (1), pp.289-333 Article dans une revue hal-00921275v1
	An algorithmic Survey of Parametric Value Function Approximation Matthieu Geist , Olivier Pietquin IEEE Transactions on Neural Networks and Learning Systems, 2013, 24 (6), pp.845-867. ⟨10.1109/TNNLS.2013.2247418⟩ Article dans une revue hal-00869725v1
	Classiﬁcation structurée pour l'apprentissage par renforcement inverse Edouard Klein , Bilal Piot , Matthieu Geist , Olivier Pietquin Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, 2013, 27 (2), pp.155-169. ⟨10.3166/ria.27.155-169⟩ Article dans une revue hal-00869723v1
	A C++ Template-Based Reinforcement Learning Library: Fitting the Code to the Mathematics Hervé Frezza-Buet , Matthieu Geist Journal of Machine Learning Research, 2013, 14 (1), pp.625-628 Article dans une revue hal-00914768v1
	A Comprehensive Reinforcement Learning Framework for Dialogue Management Optimisation Lucie Daubigney , Matthieu Geist , Senthilkumar Chandramohan , Olivier Pietquin IEEE Journal of Selected Topics in Signal Processing, 2012, 6 (8), pp.891-902. ⟨10.1109/JSTSP.2012.2229257⟩ Article dans une revue hal-00771646v1
	Sample-Efficient Batch Reinforcement Learning for Dialogue Management Optimization Olivier Pietquin , Matthieu Geist , Senthilkumar Chandramohan , Hervé Frezza-Buet ACM - Transactions on Speech and Language Processing, 2011, 7 (3), pp.art. 7 (1-21). ⟨10.1145/1966407.1966412⟩ Article dans une revue hal-00617517v1
	Kalman Temporal Differences Matthieu Geist , Olivier Pietquin Journal of Artificial Intelligence Research, 2010, 39, pp.483-532 Article dans une revue hal-00858687v1
	Différences temporelles de Kalman: Cas déterministe Matthieu Geist , Olivier Pietquin , Gabriel Fricout Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, 2010, 24 (4), pp.423-443. ⟨10.3166/ria.24.423-443⟩ Article dans une revue hal-00512093v1
	From Supervised to Reinforcement Learning: a Kernel-based Bayesian Filtering Framework Matthieu Geist , Olivier Pietquin , Gabriel Fricout International Journal On Advances in Software, 2009, 2 (1), pp.101-116 Article dans une revue hal-00429891v1

	Localisation, Cartographie et Calibration de la Dispersion pour l'Inspection Robotique de Structures en Métal par Ondes Guidées Othmane Ouabi , Pascal Pomarède , Nico Declercq , Neil Zeghidour , Matthieu Geist 16ème Congrès Français d'Acoustique, CFA2022, Société Française d'Acoustique; Laboratoire de Mécanique et d'Acoustique, Apr 2022, Marseille, France Communication dans un congrès hal-03848450v1
	Primal Wasserstein Imitation Learning Robert Dadashi , Léonard Hussenot , Matthieu Geist , Olivier Pietquin ICLR 2021 - Ninth International Conference on Learning Representations, May 2021, Vienna / Virtual, Austria Communication dans un congrès hal-03162526v1
	Show me the Way: Intrinsic Motivation from Demonstrations Léonard Hussenot , Robert Dadashi , Matthieu Geist , Olivier Pietquin AAMAS 2021 - 20th International Conference on Autonomous Agents and Multiagent Systems, May 2021, Virtual, United Kingdom Communication dans un congrès hal-03162139v1
	Adversarially Guided Actor-Critic Yannis Flet-Berliac , Johan Ferret , Olivier Pietquin , Philippe Preux , Matthieu Geist ICLR 2021 - International Conference on Learning Representations, May 2021, Vienna / Virtual, Austria Communication dans un congrès hal-03167169v1
	What Matters In On-Policy Reinforcement Learning? A Large-Scale Empirical Study Marcin Andrychowicz , Anton Raichuk , Piotr Stańczyk , Manu Orsini , Sertan Girgin ICLR 2021 - Ninth International Conference on Learning Representations, May 2021, Vienna / Virtual, Austria Communication dans un congrès hal-03162554v1
	Image-Based Place Recognition on Bucolic Environment Across Seasons From Semantic Edge Description Assia Benbihi , Stéphanie Aravecchia , Matthieu Geist , Cedric Pradalier 2020 IEEE International Conference on Robotics and Automation (ICRA), May 2020, Paris, France. pp.3032-3038, ⟨10.1109/ICRA40945.2020.9197529⟩ Communication dans un congrès hal-03157977v1
	Modified Actor-Critics Erinc Merdivan , Sten Hanke , Matthieu Geist AAMAS2020 - International Conference on Autonomous Agents and MultiAgent Systems, May 2020, virtual, New Zealand Communication dans un congrès hal-03081704v1
	Self-Attentional Credit Assignment for Transfer in Reinforcement Learning Johan Ferret , Raphaël Marinier , Matthieu Geist , Olivier Pietquin IJCAI 2020 - 29th International Joint Conference on Artificial Intelligence, Jul 2020, Yokohama / Virtual, Japan Communication dans un congrès hal-03159832v1
	Monte-Carlo Localization on Metal Plates Based on Ultrasonic Guided Waves Othmane-Latif Ouabi , Pascal Pomarede , Matthieu Geist , Nico Felicien Declercq , Cedric Pradalier International Symposium on Experimental Robotics, Nov 2020, Malte, Malta Communication dans un congrès hal-03120508v1
	CopyCAT: Taking Control of Neural Policies with Constant Attacks Léonard Hussenot , Matthieu Geist , Olivier Pietquin AAMAS 2020 - 19th International Conference on Autonomous Agents and Multi-Agent Systems, May 2020, Virtual, New Zealand Communication dans un congrès hal-03162124v1
	Momentum in Reinforcement Learning Nino Vieillard , Bruno Scherrer , Olivier Pietquin , Matthieu Geist AISTATS 2020 - 23rd International Conference on Artificial Intelligence and Statistics, Aug 2020, Palermo / Virtual, Italy Communication dans un congrès hal-03137343v1
	A Theory of Regularized Markov Decision Processes Matthieu Geist , Bruno Scherrer , Olivier Pietquin ICML 2019 - Thirty-sixth International Conference on Machine Learning, Jun 2019, Long Island, United States Communication dans un congrès hal-02273741v1
	Importance Sampling for Deep System Identification Antoine Mahé , Antoine Richard , Benjamin Mouscadet , Cedric Pradalier , Matthieu Geist 19th International Conference on Advanced Robotics (ICAR), 2019, Belo Horizonte, Brazil. ⟨10.1109/ICAR46387.2019.8981590⟩ Communication dans un congrès hal-02278171v1
	Image-Based Text Classification using 2D Convolutional Neural Networks Erinc Merdivan , Anastasios Vafeiadis , Dimitrios Kalatzis , Sten Hanke , Joahannes Kroph 2019 IEEE SmartWorld, Ubiquitous Intelligence & Computing, Advanced & Trusted Computing, Scalable Computing & Communications, Cloud & Big Data Computing, Internet of People and Smart City Innovation (SmartWorld/SCALCOM/UIC/ATC/CBDCom/IOP/SCI), Aug 2019, Leicester, United Kingdom. pp.144-149, ⟨10.1109/SmartWorld-UIC-ATC-SCALCOM-IOP-SCI.2019.00066⟩ Communication dans un congrès hal-03081713v1
	Anderson acceleration for reinforcement learning Matthieu Geist , Bruno Scherrer EWRL 2018 - 4th European workshop on Reinforcement Learning, Oct 2018, Lille, France Communication dans un congrès hal-01928142v1
	Trajectory-control using deep system identification and model predictive control for drone control under uncertain load Antoine Mahé , Cédric Pradalier , Matthieu Geist 2018 22nd International Conference on System Theory, Control and Computing (ICSTCC), Oct 2018, Sinaia, Romania. ⟨10.1109/ICSTCC.2018.8540719⟩ Communication dans un congrès hal-01927035v1
	A Deep Learning Approach for Privacy Preservation in Assisted Living Ismini Psychoula , Erinc Merdivan , Deepika Singh , Liming Chen , Feng Chen 2018 IEEE International Conference on Pervasive Computing and Communications Workshops (PerCom Workshops), Mar 2018, Athens, Greece. pp.710-715, ⟨10.1109/PERCOMW.2018.8480247⟩ Communication dans un congrès hal-03081669v1
	Faut-il minimiser le résidu de Bellman ou maximiser la valeur moyenne ? Matthieu Geist , Bilal Piot , Olivier Pietquin Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes (JFPDA 2017), Jul 2017, Caen, France Communication dans un congrès hal-01576347v1
	Real time degradation identification of UAV using machine learning techniques Anush Manukyan , Olivares-Mendez Miguel , Holger Voos , Matthieu Geist International Conference on Unmanned Aircraft Systems (ICUAS), 2017, Miami, United States Communication dans un congrès hal-01629680v1
	Reconstruct & Crush Network Erinc Merdivan , Mohammad Reza Loghmani , Matthieu Geist Advances in Neural Information Processing Systems, 2017, Long Beach, United States Communication dans un congrès hal-01629742v1
	Is the Bellman residual a bad proxy? Matthieu Geist , Bilal Piot , Olivier Pietquin NIPS 2017 - Advances in Neural Information Processing Systems, Dec 2017, Long Beach, United States. pp.1-13 Communication dans un congrès hal-01629739v1
	Human activity recognition using recurrent neural networks Deepika Singh , Erinc Merdivan , Ismini Psychoula , Johannes Kropf , Sten Hanke 1st International Cross-Domain Conference for Machine Learning and Knowledge Extraction (CD-MAKE), Aug 2017, Reggio, Italy. pp.267-274, ⟨10.1007/978-3-319-66808-6_18⟩ Communication dans un congrès hal-01629704v1
	Score-based Inverse Reinforcement Learning Layla El Asri , Bilal Piot , Matthieu Geist , Romain Laroche , Olivier Pietquin International Conference on Autonomous Agents and Multiagent Systems (AAMAS 2016), May 2016, Singapore, Singapore Communication dans un congrès hal-01406886v1
	Softened approximate policy iteration for Markov games Julien Pérolat , Bilal Piot , Matthieu Geist , Bruno Scherrer , Olivier Pietquin ICML 2016 - 33rd International Conference on Machine Learning, Jun 2016, New York City, United States Communication dans un congrès hal-01393328v1
	Batch Policy Iteration Algorithms for Continuous Domains Bilal Piot , Matthieu Geist , Olivier Pietquin European Workshop on Reinforcement Learning (EWRL), 2016, Barcelone, Spain Communication dans un congrès hal-01629651v1
	Inverse Reinforcement Learning in Relational Domains Thibaut Munzer , Bilal Piot , Matthieu Geist , Olivier Pietquin , Manuel Lopes International Joint Conferences on Artificial Intelligence, Jul 2015, Buenos Aires, Argentina Communication dans un congrès hal-01154650v1
	A multiplicative UCB strategy for Gamma rewards Matthieu Geist European Workshop on Reinforcement Learning, 2015, Lille, France Communication dans un congrès hal-01258820v1
	Imitation Learning Applied to Embodied Conversational Agents Bilal Piot , Matthieu Geist , Olivier Pietquin 4th Workshop on Machine Learning for Interactive Systems (MLIS 2015), Jul 2015, Lille, France Communication dans un congrès hal-01225816v1
	Difference of Convex Functions Programming for Reinforcement Learning Bilal Piot , Matthieu Geist , Olivier Pietquin Advances in Neural Information Processing Systems (NIPS 2014), Dec 2014, Montreal, Canada Communication dans un congrès hal-01104419v1
	Boosted and Reward-regularized Classification for Apprenticeship Learning Bilal Piot , Matthieu Geist , Olivier Pietquin AAMAS 2014 : 13th International Conference on Autonomous Agents and Multiagent Systems, May 2014, Paris, France. pp.1249-1256 Communication dans un congrès hal-01107837v1
	Quand l'optimalité locale implique une garantie globale : recherche locale de politique dans un espace convexe et algorithme d'itération sur les politiques conservatif vu comme une montée de gradient fonctionnel Bruno Scherrer , Matthieu Geist 9èmes Journées Francophones de Planification, Décision et Apprentissage (JFPDA'14), May 2014, Liège, Belgique Communication dans un congrès hal-01104776v1
	Local Policy Search in a Convex Space and Conservative Policy Iteration as Boosted Policy Search Bruno Scherrer , Matthieu Geist ECML, Sep 2014, Nancy, France. pp.35 - 50, ⟨10.1007/978-3-662-44845-8_3⟩ Communication dans un congrès hal-01091079v1
	Boosted Bellman Residual Minimization Handling Expert Demonstrations Bilal Piot , Matthieu Geist , Olivier Pietquin European Conference, ECML PKDD 2014, Sep 2014, Nancy, France. pp.549-564, ⟨10.1007/978-3-662-44851-9_35⟩ Communication dans un congrès hal-01060953v1
	Predicting when to laugh with structured classification Bilal Piot , Olivier Pietquin , Matthieu Geist InterSpeech 2014, Sep 2014, Singapore, Singapore. pp.1786-1790 Communication dans un congrès hal-01104739v1
	Méthode de minimisation du résidu de Bellman boostée qui tient compte des démonstrations expertes. Bilal Piot , Matthieu Geist , Olivier Pietquin 9èmes Journées Francophones de Planification, Décision et Apprentissage (JFPDA'14), May 2014, Liège, Belgique Communication dans un congrès hal-01104789v1
	Local Policy Search in a Convex Space and Conservative Policy Iteration as Boosted Policy Search Bruno Scherrer , Matthieu Geist ECMLPKDD 2014, Sep 2014, Nancy, France. pp.35 - 50, ⟨10.1007/978-3-662-44845-8_3⟩ Communication dans un congrès hal-01086345v1
	Model-free POMDP optimisation of tutoring systems with echo-state networks Lucie Daubigney , Matthieu Geist , Olivier Pietquin SIGDial 2013, Aug 2013, Metz, France. pp.102-106 Communication dans un congrès hal-00869773v1
	Learning from Demonstrations: Is It Worth Estimating a Reward Function? Bilal Piot , Matthieu Geist , Olivier Pietquin Joint European Conference on Machine Learning and Knowledge Discovery in Databases (ECML/PKDD 2013), Sep 2013, Prague, Czech Republic. pp.17-32, ⟨10.1007/978-3-642-40988-2_2⟩ Communication dans un congrès hal-00869801v1
	Apprentissage par démonstrations : vaut-il la peine d'estimer une fonction de récompense? Bilal Piot , Matthieu Geist , Olivier Pietquin Journées Francophones de Plannification, Décision et Apprentissage (JFPDA), Jul 2013, Lille, France Communication dans un congrès hal-00916941v1
	Optimisation par essaims particulaires de stratégies de dialogue Lucie Daubigney , Matthieu Geist , Olivier Pietquin Journées Francophones de Plannification, Décision et Apprentissage (JFPDA), Jul 2013, Lille, France Communication dans un congrès hal-00918425v1
	Laugh-aware virtual agent and its impact on user amusement Radoslaw Niewiadomski , Jennifer Hofmann , Jérôme Urbain , Tracey Platt , Johannes Wagner AAMAS '13, May 2013, Saint Paul, Minnesota, United States. pp.619-626 Communication dans un congrès hal-00869751v1
	Learning from demonstrations: Is it worth estimating a reward function? Bilal Piot , Matthieu Geist , Olivier Pietquin 1st Multidisciplinary Conference on Reinforcement Learning and Decision Making (RLDM 2013), Oct 2013, Princeton, New Jersey, United States Communication dans un congrès hal-00916938v1
	Classification régularisée par la récompense pour l'Apprentissage par Imitation Bilal Piot , Matthieu Geist , Olivier Pietquin Journées Francophones de Plannification, Décision et Apprentissage (JFPDA), Jul 2013, Lille, France Communication dans un congrès hal-00916940v1
	Apprentissage par renforcement inverse en cascadant classification et régression Edouard Klein , Bilal Piot , Matthieu Geist , Olivier Pietquin Journées Francophones de Plannification, Décision et Apprentissage (JFPDA), Jul 2013, Lille, France Communication dans un congrès hal-00916942v1
	Around Inverse Reinforcement Learning and Score-based Classification Matthieu Geist , Edouard Klein , Bilal Piot , Yann Guermeur , Olivier Pietquin 1st Multidisciplinary Conference on Reinforcement Learning and Decision Making (RLDM 2013), Oct 2013, Princeton, New Jersey, United States Communication dans un congrès hal-00916936v1
	A cascaded supervised learning approach to inverse reinforcement learning Edouard Klein , Bilal Piot , Matthieu Geist , Olivier Pietquin Joint European Conference on Machine Learning and Knowledge Discovery in Databases (ECML/PKDD 2013), Sep 2013, Prague, Czech Republic. pp.1-16, ⟨10.1007/978-3-642-40988-2_1⟩ Communication dans un congrès hal-00869804v1
	Random Projections: a Remedy for Overfitting Issues in Time Series Prediction with Echo State Networks Lucie Daubigney , Matthieu Geist , Olivier Pietquin ICASSP 2013, May 2013, Vancouver, Canada. pp.3253-3257, ⟨10.1109/ICASSP.2013.6638259⟩ Communication dans un congrès hal-00869814v1
	Particle Swarm Optimisation of Spoken Dialogue System Strategies Lucie Daubigney , Matthieu Geist , Olivier Pietquin Interspeech 2013, Aug 2013, Lyon, France. pp.1-5 Communication dans un congrès hal-00916935v1
	Co-adaptation in Spoken Dialogue Systems Senthilkumar Chandramohan , Matthieu Geist , Fabrice Lefèvre , Olivier Pietquin IWSDS 2012, Nov 2012, Paris, France. pp.1 Communication dans un congrès hal-00778752v1
	Monte-Carlo Swarm Policy Search Jérémy Fix , Matthieu Geist Symposium on Swarm Intelligence and Differential Evolution, Apr 2012, Zakopane, Poland. pp.75-83, ⟨10.1007/978-3-642-29353-5_9⟩ Communication dans un congrès hal-00695540v1
	Optimisation d'un tuteur intelligent à partir d'un jeu de données fixé Lucie Daubigney , Matthieu Geist , Olivier Pietquin JEP 2012, Jun 2012, Grenoble, France. pp.241-248 Communication dans un congrès hal-00749498v1
	Off-policy Learning in Large-scale POMDP-based Dialogue Systems Lucie Daubigney , Matthieu Geist , Olivier Pietquin ICASSP 2012, Mar 2012, Kyoto, Japan. pp.4989-4992 Communication dans un congrès hal-00684819v1
	Inverse Reinforcement Learning through Structured Classification Edouard Klein , Matthieu Geist , Bilal Piot , Olivier Pietquin NIPS 2012, Dec 2012, Lake Tahoe, Nevada, United States. pp.1-9 Communication dans un congrès hal-00778624v1
	Filtering of pathological ventricular rhythms during MRI scanning Julien Oster , Matthieu Geist , Olivier Pietquin , Gary D. Clifford BSI2012, Jul 2012, Como, Italy. pp.97-100 Communication dans un congrès hal-00749457v1
	Optimisation de contrôleurs par essaim particulaire Jérémy Fix , Matthieu Geist Conférence Francophone sur l'Apprentissage Automatique - CAp 2012, May 2012, Nancy, France. pp.1-14 Communication dans un congrès hal-00701945v1
	Structured Classification for Inverse Reinforcement Learning Edouard Klein , Bilal Piot , Matthieu Geist , Olivier Pietquin EWRL 2012, Jun 2012, Edinburgh, United Kingdom. pp.1-14 Communication dans un congrès hal-00749524v1
	Un sélecteur de Dantzig pour l'apprentissage par différences temporelles Matthieu Geist , Bruno Scherrer , Alessandro Lazaric , Mohammad Ghavamzadeh Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 13 p Communication dans un congrès hal-00736229v1
	Clustering Behaviors Of Spoken Dialogue Systems Users Senthilkumar Chandramohan , Matthieu Geist , Fabrice Lefèvre , Olivier Pietquin ICASSP 2012, Mar 2012, Kyoto, Japan. pp.4981-4984 Communication dans un congrès hal-00685009v1
	Classification structurée pour l'apprentissage par renforcement inverse Edouard Klein , Bilal Piot , Matthieu Geist , Olivier Pietquin Conférence Francophone sur l'Apprentissage Automatique - CAp 2012, May 2012, Nancy, France. pp.1-16 Communication dans un congrès hal-00701947v1
	Approximations de l'Algorithme Itérations sur les Politiques Modifié Bruno Scherrer , Victor Gabillon , Mohammad Ghavamzadeh , Matthieu Geist Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 1 p Communication dans un congrès hal-00736226v1
	A Dantzig Selector Approach to Temporal Difference Learning Matthieu Geist , Bruno Scherrer , Alessandro Lazaric , Mohammad Ghavamzadeh ICML-12, Jun 2012, Edinburgh, United Kingdom. pp.1399-1406 Communication dans un congrès hal-00749480v1
	Regroupement non-supervisé d'utilisateurs par leur comportement pour les systèmes de dialogue parlé Senthilkumar Chandramohan , Matthieu Geist , Fabrice Lefèvre , Olivier Pietquin Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 16 p Communication dans un congrès hal-00736205v1
	Behavior Specific User Simulation in Spoken Dialogue Systems Senthilkumar Chandramohan , Matthieu Geist , Fabrice Lefèvre , Olivier Pietquin 10th ITG Conference on Speech Communication, Sep 2012, Braunschweig, Germany. pp.1-4 Communication dans un congrès hal-00749421v1
	Approximate Modified Policy Iteration Bruno Scherrer , Mohammad Ghavamzadeh , Victor Gabillon , Matthieu Geist 29th International Conference on Machine Learning - ICML 2012, Jun 2012, Edinburgh, United Kingdom Communication dans un congrès hal-00758882v1
	Apprentissage off-policy appliqué à un système de dialogue basé sur les PDMPO Lucie Daubigney , Matthieu Geist , Olivier Pietquin RFIA 2012 (Reconnaissance des Formes et Intelligence Artificielle), Jan 2012, Lyon, France. pp.978-2-9539515-2-3 Communication dans un congrès hal-00656496v1
	Parametric value function approximation: A unified view Matthieu Geist , Olivier Pietquin ADPRL 2011, Apr 2011, Paris, France. pp.9-16, ⟨10.1109/ADPRL.2011.5967355⟩ Communication dans un congrès hal-00618112v1
	Optimization of a Tutoring System from a Fixed Set of Data Olivier Pietquin , Lucie Daubigney , Matthieu Geist SLaTE 2011, Aug 2011, Venice, Italy. pp.1-4 Communication dans un congrès hal-00652324v1
	Performance evaluation for particle filters Remi Chou , Yvo Boers , Martin Podt , Matthieu Geist FUSION 2011, Jul 2011, Chicago, United States. pp.1-7 Communication dans un congrès hal-00652168v1
	Sample Efficient On-line Learning of Optimal Dialogue Policies with Kalman Temporal Differences Olivier Pietquin , Matthieu Geist , Senthilkumar Chandramohan IJCAI 2011, Jul 2011, Barcelona, Spain. pp.1878-1883 Communication dans un congrès hal-00618252v1
	l1-penalized projected Bellman residual Matthieu Geist , Bruno Scherrer European Wrokshop on Reinforcement Learning (EWRL 11), Sep 2011, Athens, Greece Communication dans un congrès hal-00644507v1
	Recursive Least-Squares Learning with Eligibility Traces Bruno Scherrer , Matthieu Geist European Wrokshop on Reinforcement Learning (EWRL 11), Sep 2011, Athens, Greece Communication dans un congrès hal-00644511v1
	Apprentissage par renforcement pour la personnalisation d'un logiciel d'enseignement des langues Lucie Daubigney , Matthieu Geist , Olivier Pietquin EIAH 2011, May 2011, Mons, Belgique. pp.1-5 Communication dans un congrès hal-00652516v1
	Uncertainty management for on-line optimisation of a POMDP-based large-scale spoken dialogue system Lucie Daubigney , Milica Gašić , Senthilkumar Chandramohan , Matthieu Geist , Olivier Pietquin Interspeech 2011, Aug 2011, Florence, Italy. pp.1301-1304 Communication dans un congrès hal-00652194v1
	Reducing the dimentionality of the reward space in the Inverse Reinforcement Learning problem Edouard Klein , Matthieu Geist , Olivier Pietquin MLASA 2011, Dec 2011, Honolulu, United States. pp.1-4 Communication dans un congrès hal-00660612v1
	Apprentissage par imitation dans un cadre batch, off-policy et sans modèle Edouard Klein , Matthieu Geist , Olivier Pietquin JFPDA 2011, Jun 2011, Rouen, France. pp.1-9 Communication dans un congrès hal-00652762v1
	Batch, Off-policy and Model-free Apprenticeship Learning Edouard Klein , Matthieu Geist , Olivier Pietquin EWRL 2011, Sep 2011, Athens, Greece. pp.1-12 Communication dans un congrès hal-00660623v1
	Batch, Off-policy and Model-Free Apprenticeship Learning Edouard Klein , Matthieu Geist , Olivier Pietquin IJCAI Workshop on Agents Learning Interactively from Human Teachers (ALIHT 2011), Jun 2011, Barcelona, Spain. 6 p Communication dans un congrès hal-00596370v1
	Gestion de l'incertitude pour l'optimisation en ligne d'un gestionnaire de dialogues parlés à grande échelle basé sur les POMDP Lucie Daubigney , Senthilkumar Chandramohan , Matthieu Geist , Olivier Pietquin JFPDA 2011, Jun 2011, Rouen, France. pp.1-7 Communication dans un congrès hal-00652511v1
	Moindres carrés récursifs pour l'évaluation off-policy d'une politique avec traces d'éligibilité Bruno Scherrer , Matthieu Geist 6ème Journées Francophones de Planification, Décision et Apprentissage pour la conduite de systèmes - JFPDA 2011, Jun 2011, Rouen, France Communication dans un congrès hal-00644874v1
	Kalman filtering & colored noises: the (autoregressive) moving-average case Matthieu Geist , Olivier Pietquin MLASA 2011, Dec 2011, Honolulu, United States. pp.1-4 Communication dans un congrès hal-00660607v1
	Dynamic Neural Field Optimization using the Unscented Kalman Filter Jérémy Fix , Matthieu Geist , Olivier Pietquin , Hervé Frezza-Buet CCMB 2011, Apr 2011, Paris, France. 7 p., ⟨10.1109/CCMB.2011.5952113⟩ Communication dans un congrès hal-00618117v1
	Apprentissage par Renforcement Inverse pour la Simulation d'Utilisateurs dans les Systèmes de Dialogue Senthilkumar Chandramohan , Matthieu Geist , Olivier Pietquin JFPDA 2011, Jun 2011, Rouen, France. pp.1-7 Communication dans un congrès hal-00652753v1
	A Non-Parametric Approach to Approximate Dynamic Programming Hadrien Glaude , Fadi Akrimi , Matthieu Geist , Olivier Pietquin ICMLA 2011, Dec 2011, Honolulu, Hawaii, United States. pp.1-6 Communication dans un congrès hal-00652438v1
	User Simulation in Dialogue Systems using Inverse Reinforcement Learning Senthilkumar Chandramohan , Matthieu Geist , Fabrice Lefèvre , Olivier Pietquin Interspeech 2011, Aug 2011, Florence, Italy. pp.1025-1028 Communication dans un congrès hal-00652446v1
	Revisiting natural actor-critics with value function approximation Matthieu Geist , Olivier Pietquin BNAIC 2010, Oct 2010, Luxembourg, Luxembourg. 1 page Communication dans un congrès hal-00553175v1
	Sparse Approximate Dynamic Programming for Dialog Management Senthilkumar Chandramohan , Matthieu Geist , Olivier Pietquin SIGDial 2010, Sep 2010, Tokyo, Japan. pp.107-115 Communication dans un congrès hal-00553180v1
	Statistically linearized least-squares temporal differences Matthieu Geist , Olivier Pietquin ICUMT 2010, Oct 2010, Moscow, Russia. pp.450-457, ⟨10.1109/ICUMT.2010.5676598⟩ Communication dans un congrès hal-00553913v1
	Managing Uncertainty within the KTD Framework Matthieu Geist , Olivier Pietquin Active Learning and Experimental Design workshop in conjunction with AISTATS 2010, May 2010, Sardinia, Italy. pp.157-168 Communication dans un congrès hal-00599636v1
	Statistical Linearization for Value Function Approximation in Reinforcement Learning Matthieu Geist NIPS Workshop on Learning and Planning from Batch Time Series Data (OPT 2010), Dec 2010, Vancouver, Canada. pp.1-6 Communication dans un congrès hal-00554324v1
	Statistically Linearized Least-Squares Temporal Differences Matthieu Geist , Olivier Pietquin 5èmes Journées Francophones de Planification, Décision et Apprentissage pour la conduite de systèmes (JFPDA'10), Jun 2010, Besançon, France Communication dans un congrès hal-00554338v1
	Astuce du Noyau & Quantification Vectorielle Matthieu Geist , Olivier Pietquin , Gabriel Fricout RFIA'10, Jan 2010, Caen, France. 8 p Communication dans un congrès hal-00553114v1
	Statistically Linearized Recursive Least Squares Matthieu Geist , Olivier Pietquin MLSP 2010, Aug 2010, Kittilä, Finland. pp.272-276, ⟨10.1109/MLSP.2010.5589236⟩ Communication dans un congrès hal-00553168v1
	Revisiting Natural Actor-Critics with Value Function Approximation Matthieu Geist , Olivier Pietquin MDAI 2010, Oct 2010, Perpignan, France. pp.207-218, ⟨10.1007/978-3-642-16292-3_21⟩ Communication dans un congrès hal-00553870v1
	Revisiting natural actor-critics with value function approximation Matthieu Geist , Olivier Pietquin 5èmes Journées Francophones de Planification, Décision et Apprentissage pour la conduite de systèmes (JFPDA'10), Jun 2010, Besançon, France Communication dans un congrès hal-00554346v1
	Managing Uncertainty within Value Function Approximation in Reinforcement Learning Matthieu Geist , Olivier Pietquin Active Learning and Experimental Design workshop (collocated with AISTATS 2010), May 2010, Sardinia, Italy Communication dans un congrès hal-00554398v1
	Eligibility Traces through Colored Noises Matthieu Geist , Olivier Pietquin ICUMT 2010, Oct 2010, Moscow, Russia. pp.458-465, ⟨10.1109/ICUMT.2010.5676597⟩ Communication dans un congrès hal-00553910v1
	Gestion de l'incertitude dans le cadre de l'approximation de la fonction de valeur pour l'apprentissage par renforcement Matthieu Geist , Olivier Pietquin CAP 2010, May 2010, Clermont-Ferrand, France. pp.101-112 Communication dans un congrès hal-00553895v1
	Optimizing Spoken Dialogue Management with Fitted Value Iteration Senthilkumar Chandramohan , Matthieu Geist , Olivier Pietquin Interspeech 2010, Sep 2010, Makuhari, Japan. pp.86-89 Communication dans un congrès hal-00553184v1
	Tracking in Reinforcement Learning Matthieu Geist , Olivier Pietquin , Gabriel Fricout 16th International Conference on Neural Information Processing - ICONIP 2009, Dec 2009, Bangkok, Thailand. pp.502-511, ⟨10.1007/978-3-642-10677-4_57⟩ Communication dans un congrès hal-00439316v1
	Différences Temporelles de Kalman Matthieu Geist , Olivier Pietquin , Gabriel Fricout JFPDA 2009, Jun 2009, Paris, France. (20 p.) Communication dans un congrès hal-00437002v1
	Différences Temporelles de Kalman : le cas stochastique Matthieu Geist , Olivier Pietquin , Gabriel Fricout JFPDA 2009, Jun 2009, Paris, France. (13 p.) Communication dans un congrès hal-00437006v1
	Kalman Temporal Differences: the deterministic case Matthieu Geist , Olivier Pietquin , Gabriel Fricout ADPRL 2009, Mar 2009, Nashville, TN, United States. pp.185-192, ⟨10.1109/ADPRL.2009.4927543⟩ Communication dans un congrès hal-00380870v1
	Kernelizing Vector Quantization Algorithms Matthieu Geist , Olivier Pietquin , Gabriel Fricout ESANN'2009, Apr 2009, Bruges, Belgium. pp.541-546 Communication dans un congrès hal-00429892v1
	Online Bayesian Kernel Regression from Nonlinear Mapping of Observations Matthieu Geist , Olivier Pietquin , Gabriel Fricout MLSP 2008, Oct 2008, Cancun, Mexico. pp.309-314, ⟨10.1109/MLSP.2008.4685498⟩ Communication dans un congrès hal-00335052v1
	Kalman Temporal Differences Matthieu Geist Cross-border workshop of PhD students in fundamental and applied mathematics (LMAM - UPVM), Dec 2008, Metz, France Communication dans un congrès hal-00351297v1
	Filtrage bayésien de la récompense Matthieu Geist , Olivier Pietquin , Gabriel Fricout JFPDA 2008, Jun 2008, Metz, France. pp.113-122 Communication dans un congrès hal-00351343v1
	A Sparse Nonlinear Bayesian Online Kernel Regression Matthieu Geist , Olivier Pietquin , Gabriel Fricout AdvComp 2008, Oct 2008, Valencia, Spain. pp.199-204, ⟨10.1109/ADVCOMP.2008.7⟩ Communication dans un congrès hal-00327081v1
	Kalman Temporal Differences: Uncertainty and Value Function Approximation Matthieu Geist , Olivier Pietquin , Gabriel Fricout NIPS Workshop on Model Uncertainty and Risk in Reinforcement Learning, Dec 2008, Vancouver, Canada Communication dans un congrès hal-00351298v1
	Bayesian Reward Filtering Matthieu Geist , Olivier Pietquin EWRL 2008, Jun 2008, Lille, France. pp.96-109, ⟨10.1007/978-3-540-89722-4_8⟩ Communication dans un congrès hal-00351282v1

	Conférence Nationale d’Intelligence Artificielle Année 2017 Sandra Bringay , Catherine Garbay , Matthieu Geist , Tiago de Lima , Catherine Roussey Association Française pour l'Intelligence Artificielle, 2017 Ouvrages hal-04489458v1

	Convolutional and Recurrent Neural Networks for Activity Recognition in Smart Environment Deepika Singh , Erinc Merdivan , Sten Hanke , Johannes Kropf , Matthieu Geist A. Holzinger; R. Goebel; M. Ferri; V. Palade. Towards Integrative Machine Learning and Knowledge Extraction, 10344, springer, pp.194-205, 2017, Lecture Notes in Computer Science Chapitre d'ouvrage hal-01629732v1

	PERIODIC ARTIFACT REDUCTION FROM BIOMEDICAL SIGNALS Gari Clifford , Julien Oster , Olivier Pietquin , Matthieu Geist France, Patent n° : WO/2013/052944. 2013 Brevet hal-00869739v1

	Apprentissage off-policy appliqué à un système de dialogue basé sur les PDMPO Lucie Daubigney , Matthieu Geist , Olivier Pietquin Actes du 18ème congrès francophone sur la Reconnaissance de Formes et l'Intelligence Artificielle (RFIA 2012), 2012, pp.1-8 Autre publication scientifique hal-00656997v1

	Fictitious Play for Mean Field Games: Continuous Time Analysis and Applications Sarah Perrin , Julien Pérolat , Mathieu Laurière , Matthieu Geist , Romuald Elie 2020 Pré-publication, Document de travail hal-02931977v1
	Filling Gaps in Micro-Meteorological Data Antoine Richard , Lior Fine , Offer Rozenstein , Joseph Tanny , Matthieu Geist 2020 Pré-publication, Document de travail hal-03091151v1
	A Comprehensive Benchmark of Neural Networks for System Identification Antoine Richard , Antoine Mahé , Cedric Pradalier , Offer Rozenstein , Matthieu Geist 2019 Pré-publication, Document de travail hal-02278102v1
	Difference of Convex Functions Programming Applied to Control with Expert Data Bilal Piot , Matthieu Geist , Olivier Pietquin 2017 Pré-publication, Document de travail hal-01629653v1
	Policy Search: Any Local Optimum Enjoys a Global Performance Guarantee Bruno Scherrer , Matthieu Geist 2013 Pré-publication, Document de travail hal-00829548v1

	Off-policy Learning with Eligibility Traces: A Survey Matthieu Geist , Bruno Scherrer [Research Report] 2013, pp.43 Rapport hal-00644516v2
	Approximate Modified Policy Iteration Bruno Scherrer , Victor Gabillon , Mohammad Ghavamzadeh , Matthieu Geist [Research Report] 2012 Rapport hal-00697169v2
	Online adaptation of dialogue systems Filip Jurcicek , Milica Gašić , Steve Young , Ghislain Putois , Romain Laroche 2011 Rapport hal-00652841v1

	Optimisation des chaînes de production dans l'industrie sidérurgique : une approche statistique de l'apprentissage par renforcement Matthieu Geist Mathématiques [math]. Université Paul Verlaine - Metz, 2009. Français. ⟨NNT : 2009METZ023S⟩ Thèse tel-01752647v2

	Contrôle optimal et apprentissage automatique, applications aux interactions homme-machine Matthieu Geist Machine Learning [stat.ML]. Université de Lille 1 - Sciences et Technologies, 2016 HDR tel-01629638v1

Matthieu GEIST

Publications

A FastSLAM Approach Integrating Beamforming Maps for Ultrasound-based Robotic Inspection of Metal Structures

Human Annotated Dialogues Dataset for Natural Conversational Agents

Bridging the Gap Between Imitation Learning and Inverse Reinforcement Learning

Approximate modified policy iteration and its application to the game of Tetris

Soft-max boosting

Recherche locale de politique dans un espace convexe

Off-policy Learning with Eligibility Traces: A Survey

An algorithmic Survey of Parametric Value Function Approximation

Classiﬁcation structurée pour l'apprentissage par renforcement inverse

A C++ Template-Based Reinforcement Learning Library: Fitting the Code to the Mathematics

A Comprehensive Reinforcement Learning Framework for Dialogue Management Optimisation

Sample-Efficient Batch Reinforcement Learning for Dialogue Management Optimization

Kalman Temporal Differences

Différences temporelles de Kalman: Cas déterministe

From Supervised to Reinforcement Learning: a Kernel-based Bayesian Filtering Framework

Localisation, Cartographie et Calibration de la Dispersion pour l'Inspection Robotique de Structures en Métal par Ondes Guidées

Primal Wasserstein Imitation Learning

Show me the Way: Intrinsic Motivation from Demonstrations

Adversarially Guided Actor-Critic

What Matters In On-Policy Reinforcement Learning? A Large-Scale Empirical Study

Image-Based Place Recognition on Bucolic Environment Across Seasons From Semantic Edge Description

Modified Actor-Critics

Self-Attentional Credit Assignment for Transfer in Reinforcement Learning

Monte-Carlo Localization on Metal Plates Based on Ultrasonic Guided Waves

CopyCAT: Taking Control of Neural Policies with Constant Attacks

Momentum in Reinforcement Learning

A Theory of Regularized Markov Decision Processes

Importance Sampling for Deep System Identification

Image-Based Text Classification using 2D Convolutional Neural Networks

Anderson acceleration for reinforcement learning

Trajectory-control using deep system identification and model predictive control for drone control under uncertain load

A Deep Learning Approach for Privacy Preservation in Assisted Living

Faut-il minimiser le résidu de Bellman ou maximiser la valeur moyenne ?

Real time degradation identification of UAV using machine learning techniques

Reconstruct & Crush Network

Is the Bellman residual a bad proxy?

Human activity recognition using recurrent neural networks

Score-based Inverse Reinforcement Learning

Softened approximate policy iteration for Markov games

Batch Policy Iteration Algorithms for Continuous Domains

Inverse Reinforcement Learning in Relational Domains

A multiplicative UCB strategy for Gamma rewards

Imitation Learning Applied to Embodied Conversational Agents

Difference of Convex Functions Programming for Reinforcement Learning

Boosted and Reward-regularized Classification for Apprenticeship Learning

Quand l'optimalité locale implique une garantie globale : recherche locale de politique dans un espace convexe et algorithme d'itération sur les politiques conservatif vu comme une montée de gradient fonctionnel

Local Policy Search in a Convex Space and Conservative Policy Iteration as Boosted Policy Search

Boosted Bellman Residual Minimization Handling Expert Demonstrations

Predicting when to laugh with structured classification

Méthode de minimisation du résidu de Bellman boostée qui tient compte des démonstrations expertes.

Local Policy Search in a Convex Space and Conservative Policy Iteration as Boosted Policy Search

Model-free POMDP optimisation of tutoring systems with echo-state networks

Learning from Demonstrations: Is It Worth Estimating a Reward Function?

Apprentissage par démonstrations : vaut-il la peine d'estimer une fonction de récompense?

Optimisation par essaims particulaires de stratégies de dialogue

Laugh-aware virtual agent and its impact on user amusement

Learning from demonstrations: Is it worth estimating a reward function?

Classification régularisée par la récompense pour l'Apprentissage par Imitation

Apprentissage par renforcement inverse en cascadant classification et régression

Around Inverse Reinforcement Learning and Score-based Classification

A cascaded supervised learning approach to inverse reinforcement learning

Random Projections: a Remedy for Overfitting Issues in Time Series Prediction with Echo State Networks

Particle Swarm Optimisation of Spoken Dialogue System Strategies

Co-adaptation in Spoken Dialogue Systems

Monte-Carlo Swarm Policy Search

Optimisation d'un tuteur intelligent à partir d'un jeu de données fixé

Off-policy Learning in Large-scale POMDP-based Dialogue Systems

Inverse Reinforcement Learning through Structured Classification

Filtering of pathological ventricular rhythms during MRI scanning

Optimisation de contrôleurs par essaim particulaire

Structured Classification for Inverse Reinforcement Learning

Un sélecteur de Dantzig pour l'apprentissage par différences temporelles

Clustering Behaviors Of Spoken Dialogue Systems Users

Classification structurée pour l'apprentissage par renforcement inverse

Approximations de l'Algorithme Itérations sur les Politiques Modifié

A Dantzig Selector Approach to Temporal Difference Learning

Regroupement non-supervisé d'utilisateurs par leur comportement pour les systèmes de dialogue parlé

Behavior Specific User Simulation in Spoken Dialogue Systems