Matthieu GEIST
11
Documents
Publications
- 4
- 3
- 4
- 11
- 11
- 7
- 1
Classification structurée pour l'apprentissage par renforcement inverseRevue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, 2013, 27 (2), pp.155-169. ⟨10.3166/ria.27.155-169⟩
Article dans une revue
hal-00869723v1
|
|
A cascaded supervised learning approach to inverse reinforcement learningJoint European Conference on Machine Learning and Knowledge Discovery in Databases (ECML/PKDD 2013), Sep 2013, Prague, Czech Republic. pp.1-16, ⟨10.1007/978-3-642-40988-2_1⟩
Communication dans un congrès
hal-00869804v1
|
Apprentissage par renforcement inverse en cascadant classification et régressionJournées Francophones de Plannification, Décision et Apprentissage (JFPDA), Jul 2013, Lille, France
Communication dans un congrès
hal-00916942v1
|
|
Around Inverse Reinforcement Learning and Score-based Classification1st Multidisciplinary Conference on Reinforcement Learning and Decision Making (RLDM 2013), Oct 2013, Princeton, New Jersey, United States
Communication dans un congrès
hal-00916936v1
|
|
|
Classification structurée pour l'apprentissage par renforcement inverseConférence Francophone sur l'Apprentissage Automatique - CAp 2012, May 2012, Nancy, France. pp.1-16
Communication dans un congrès
hal-00701947v1
|
Structured Classification for Inverse Reinforcement LearningEWRL 2012, Jun 2012, Edinburgh, United Kingdom. pp.1-14
Communication dans un congrès
hal-00749524v1
|
|
|
Inverse Reinforcement Learning through Structured ClassificationNIPS 2012, Dec 2012, Lake Tahoe, Nevada, United States. pp.1-9
Communication dans un congrès
hal-00778624v1
|
Batch, Off-policy and Model-free Apprenticeship LearningEWRL 2011, Sep 2011, Athens, Greece. pp.1-12
Communication dans un congrès
hal-00660623v1
|
|
Batch, Off-policy and Model-Free Apprenticeship LearningIJCAI Workshop on Agents Learning Interactively from Human Teachers (ALIHT 2011), Jun 2011, Barcelona, Spain. 6 p
Communication dans un congrès
hal-00596370v1
|
|
Reducing the dimentionality of the reward space in the Inverse Reinforcement Learning problemMLASA 2011, Dec 2011, Honolulu, United States. pp.1-4
Communication dans un congrès
hal-00660612v1
|
|
|
Apprentissage par imitation dans un cadre batch, off-policy et sans modèleJFPDA 2011, Jun 2011, Rouen, France. pp.1-9
Communication dans un congrès
hal-00652762v1
|