Recherche - Archive ouverte HAL Accéder directement au contenu

Filtrer vos résultats

7 résultats
Image document

Vers des architectures acteur-critique neuronales efficaces en données

Matthieu Zimmer , Yann Boniface , Alain Dutech
Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes, Jul 2016, Grenoble, France
Communication dans un congrès hal-01344905v1
Image document

Toward a data efficient neural actor-critic

Matthieu Zimmer , Yann Boniface , Alain Dutech
EWRL 2016 - The 13th European Workshop on Reinforcement Learning, Dec 2016, Barcelona, Spain
Communication dans un congrès hal-01413885v1
Image document

Teacher-Student Framework: a Reinforcement Learning Approach

Matthieu Zimmer , Paolo Viappiani , Paul Weng
AAMAS Workshop Autonomous Robots and Multirobot Systems, May 2014, Paris, France
Communication dans un congrès hal-01215273v1
Image document

Exploiting the sign of the advantage function to learn deterministic policies in continuous domains

Matthieu Zimmer , Paul Weng
International Joint Conferences on Artificial Intelligence, Aug 2019, Macao, China
Communication dans un congrès hal-02145083v2
Image document

Bootstrapping Q-Learning for Robotics from Neuro-Evolution Results

Matthieu Zimmer , Stephane Doncieux
IEEE Transactions on Cognitive and Developmental Systems, 2017, ⟨10.1109/TCDS.2016.2628817⟩
Article dans une revue hal-01494744v1
Image document

Neural Fitted Actor-Critic

Matthieu Zimmer , Yann Boniface , Alain Dutech
ESANN 2016 - Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning, Apr 2016, Bruges, Belgium
Communication dans un congrès hal-01350651v1
Image document

Developmental Reinforcement Learning through Sensorimotor Space Enlargement

Matthieu Zimmer , Yann Boniface , Alain Dutech
ICDL-EPIROB 2018 - 8th joint IEEE International Conference on Development and Learning and on Epigenetic Robotics, Sep 2018, Tokyo, Japan. pp.1-6, ⟨10.1109/DEVLRN.2018.8761021⟩
Communication dans un congrès hal-01876995v2