Number of documents

20

Matthieu Geist


2012   

Journal articles1 document

  • Lucie Daubigney, Matthieu Geist, Senthilkumar Chandramohan, Olivier Pietquin. A Comprehensive Reinforcement Learning Framework for Dialogue Management Optimisation. IEEE Journal of Selected Topcis in Signal Processing, 2012, 6 (8), pp.891-902. ⟨10.1109/JSTSP.2012.2229257⟩. ⟨hal-00771646⟩

Conference papers17 documents

  • Jérémy Fix, Matthieu Geist. Optimisation de contrôleurs par essaim particulaire. Conférence Francophone sur l'Apprentissage Automatique - CAp 2012, May 2012, Nancy, France. pp.1-14. ⟨hal-00701945⟩
  • Bruno Scherrer, Mohammad Ghavamzadeh, Victor Gabillon, Matthieu Geist. Approximate Modified Policy Iteration. 29th International Conference on Machine Learning - ICML 2012, Jun 2012, Edinburgh, United Kingdom. ⟨hal-00758882⟩
  • Bruno Scherrer, Victor Gabillon, Mohammad Ghavamzadeh, Matthieu Geist. Approximations de l'Algorithme Itérations sur les Politiques Modifié. Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 1 p. ⟨hal-00736226⟩
  • Senthilkumar Chandramohan, Matthieu Geist, Fabrice Lefèvre, Olivier Pietquin. Regroupement non-supervisé d'utilisateurs par leur comportement pour les systèmes de dialogue parlé. Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 16 p. ⟨hal-00736205⟩
  • Lucie Daubigney, Matthieu Geist, Olivier Pietquin. Off-policy Learning in Large-scale POMDP-based Dialogue Systems. ICASSP 2012, Mar 2012, Kyoto, Japan. pp.4989-4992. ⟨hal-00684819⟩
  • Senthilkumar Chandramohan, Matthieu Geist, Fabrice Lefèvre, Olivier Pietquin. Co-adaptation in Spoken Dialogue Systems. IWSDS 2012, Nov 2012, Paris, France. pp.1. ⟨hal-00778752⟩
  • Edouard Klein, Bilal Piot, Matthieu Geist, Olivier Pietquin. Structured Classification for Inverse Reinforcement Learning. EWRL 2012, Jun 2012, Edinburgh, United Kingdom. pp.1-14. ⟨hal-00749524⟩
  • Senthilkumar Chandramohan, Matthieu Geist, Fabrice Lefèvre, Olivier Pietquin. Clustering Behaviors Of Spoken Dialogue Systems Users. ICASSP 2012, Mar 2012, Kyoto, Japan. pp.4981-4984. ⟨hal-00685009⟩
  • Lucie Daubigney, Matthieu Geist, Olivier Pietquin. Apprentissage off-policy appliqué à un système de dialogue basé sur les PDMPO. RFIA 2012 (Reconnaissance des Formes et Intelligence Artificielle), Jan 2012, Lyon, France. pp.978-2-9539515-2-3. ⟨hal-00656496⟩
  • Matthieu Geist, Bruno Scherrer, Alessandro Lazaric, Mohammad Ghavamzadeh. A Dantzig Selector Approach to Temporal Difference Learning. ICML-12, Jun 2012, Edinburgh, United Kingdom. pp.1399-1406. ⟨hal-00749480⟩
  • Jérémy Fix, Matthieu Geist. Monte-Carlo Swarm Policy Search. Symposium on Swarm Intelligence and Differential Evolution, Apr 2012, Zakopane, Poland. pp.75-83, ⟨10.1007/978-3-642-29353-5_9⟩. ⟨hal-00695540⟩
  • Matthieu Geist, Bruno Scherrer, Alessandro Lazaric, Mohammad Ghavamzadeh. Un sélecteur de Dantzig pour l'apprentissage par différences temporelles. Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 13 p. ⟨hal-00736229⟩
  • Julien Oster, Matthieu Geist, Olivier Pietquin, Gary Clifford. Filtering of pathological ventricular rhythms during MRI scanning. BSI2012, Jul 2012, Como, Italy. pp.97-100. ⟨hal-00749457⟩
  • Senthilkumar Chandramohan, Matthieu Geist, Fabrice Lefèvre, Olivier Pietquin. Behavior Specific User Simulation in Spoken Dialogue Systems. 10th ITG Conference on Speech Communication, Sep 2012, Braunschweig, Germany. pp.1-4. ⟨hal-00749421⟩
  • Lucie Daubigney, Matthieu Geist, Olivier Pietquin. Optimisation d'un tuteur intelligent à partir d'un jeu de données fixé. JEP 2012, Jun 2012, Grenoble, France. pp.241-248. ⟨hal-00749498⟩
  • Edouard Klein, Matthieu Geist, Bilal Piot, Olivier Pietquin. Inverse Reinforcement Learning through Structured Classification. NIPS 2012, Dec 2012, Lake Tahoe, Nevada, United States. pp.1-9. ⟨hal-00778624⟩
  • Edouard Klein, Bilal Piot, Matthieu Geist, Olivier Pietquin. Classification structurée pour l'apprentissage par renforcement inverse. Conférence Francophone sur l'Apprentissage Automatique - CAp 2012, May 2012, Nancy, France. pp.1-16. ⟨hal-00701947⟩

Other publications1 document

  • Lucie Daubigney, Matthieu Geist, Olivier Pietquin. Apprentissage off-policy appliqué à un système de dialogue basé sur les PDMPO. Actes du 18ème congrès francophone sur la Reconnaissance de Formes et l'Intelligence Artificielle (RFIA 2012), 2012, pp.1-8. ⟨hal-00656997⟩

Reports1 document

  • Bruno Scherrer, Victor Gabillon, Mohammad Ghavamzadeh, Matthieu Geist. Approximate Modified Policy Iteration. [Research Report] 2012. ⟨hal-00697169v2⟩