Recherche - Archive ouverte HAL Accéder directement au contenu

Filtrer vos résultats

70 résultats

Apprentissage par renforcement pour la conception de Systèmes Multi-Agents Réactifs

Alain Dutech , Olivier Buffet , François Charpillet
Journées Francophones sur les Systèmes Multi-Agents 2003 - JFSMA'03, 2003, Hammamet, Tunise, pp.219-231
Communication dans un congrès inria-00099564v1

Multi-Agent Systems by Incremental Gradient Reinforcement Learning.

Alain Dutech , Olivier Buffet , François Charpillet
17th International Joint Conference on Artificial Intelligence, 2001, Seattle, WA, USA, pp.833--838
Communication dans un congrès inria-00101090v1

QUALCOM : une expérience sur la qualification des comportements d’une lampe robotique

Joffrey Becker , Virginie Andre , Alain Dutech
Techniques et culture, 2019, Varia, ⟨10.4000/tc.10771⟩
Article dans une revue hal-02075467v1

Incremental reinforcement learning for designing multi-agent systems

Olivier Buffet , François Charpillet , Alain Dutech
5th International Conference on Autonomous Agents, Jun 2001, Montréal, Canada, 8 p
Communication dans un congrès inria-00100538v1

Learning to weigh basic behaviors in Scalable Agents

Olivier Buffet , Alain Dutech , François Charpillet
First International Joint Conference on Autonomous Agents and Multiagent Systems - AAMAS 2002, 2002, Bologna, Italy, pp.1264-1265
Communication dans un congrès inria-00100765v1
Image document

Réservoir computing" et Apprentissage par Renforcement Développemental

Alain Dutech
Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 13 p
Communication dans un congrès hal-00736316v1
Image document

Online Learning with Noise: A Kernel-Based Policy-Gradient Approach

Emmanuel Daucé , Alain Dutech
Conférence Française de Neurosciences Computationnelles - NeuroComp 2010, Oct 2010, Lyon, France
Communication dans un congrès inria-00517006v1
Image document

Apprentissage par renforcement et jeux stochastiques à information incomplète

Raghav Aras , Alain Dutech
Cinquièmes Journées Nationales sur Processus Décisionnel de Markov et Intelligence Artificielle - PDMIA'05, Jun 2005, Lille/France
Communication dans un congrès inria-00000212v1
Image document

Apprentissage par Renforcement Développemental en Robotique Autonome

Luc Sarzyniec , Olivier Buffet , Alain Dutech
Conférence d'Apprentissage - CAP 2011, May 2011, Chambéry, France
Communication dans un congrès inria-00633426v1
Image document

Proteus, des web services pour les systèmes de maintenance

Xavier Rebeuf , Nicolas Blanc , François Charpillet , Denis Chevé , Alain Dutech , et al.
Nouvelles Technologie de la Répartition - NOTERE'04, Concordia University, 2004, Saidia/Maroc, pp.163-178
Communication dans un congrès inria-00107792v1
Image document

Toward a data efficient neural actor-critic

Matthieu Zimmer , Yann Boniface , Alain Dutech
EWRL 2016 - The 13th European Workshop on Reinforcement Learning, Dec 2016, Barcelona, Spain
Communication dans un congrès hal-01413885v1
Image document

Exploring Sensitization in the Context of Extending the Behavior of an Artificial Agent

Tristan Gillard , Jérémy Fix , Alain Dutech
International Conference on Simulation of Adaptive Behavior (SAB22), Sep 2022, Cergy-Pontoise, France. pp.15-27, ⟨10.1007/978-3-031-16770-6_2⟩
Communication dans un congrès hal-04031636v1

How do we make sense of a robot’s behavior? An experimental case study

Joffrey Becker , Virginie André , Alain Dutech
IACS4- 4th Conference of the International Association for Cognitive Semiotics, KU Leuven; RWTH Aachen University, Jun 2022, Virtual Conference, Germany
Communication dans un congrès hal-03698516v1

Towards the Usage of Advanced Behavioral Simulations for Simultaneous Tracking and Activity Recognition.

Arsène Fansi Tchango , Vincent Thomas , Olivier Buffet , Fabien Flacher , Alain Dutech
STAIRS 2014 - Proceedings of the Seventh European Starting AI Researcher Symposium, Aug 2014, Pragues, Czech Republic
Communication dans un congrès hal-01073427v1
Image document

Self-organizing developmental reinforcement learning

Alain Dutech
International Conference on Simulated Animal Behavior, 2012, Odense, Denmark
Communication dans un congrès hal-00705350v1
Image document

Reinforcement Learning Approaches to Instrumental Contingency Degradation in Rats

Alain Dutech , Etienne Coutureau , Alain Marchand
Conférence Française de Neurosciences Computationnelles - NeuroComp 2010, Oct 2010, Lyon, France
Communication dans un congrès inria-00517011v1

Processus décisionnels de Markov partiellement observables

Alain Dutech , Bruno Scherrer
O. Sigaud and O. Buffet. Processus décisionnels de Markov en intelligence artificielle, 1 - principes généraux et applications, Lavoisier - Hermes Science Publications, pp.89-133, 2008, IC2 - informatique et systèmes d'information, 978-2746220577
Chapitre d'ouvrage inria-00335158v1
Image document

An investigation into Mathematical Programming for Finite Horizon Decentralized POMDPs

Raghav Aras , Alain Dutech
Journal of Artificial Intelligence Research, 2010, 37, pp.329-396. ⟨10.1613/jair.2915⟩
Article dans une revue inria-00439627v1
Image document

Émergence et apprentissage d'information dans un modèle multimodal de cartes CNFT impulsionnelles

Selma Belgacem , Yann Boniface , Alain Dutech
2009
Pré-publication, Document de travail hal-00802908v1
Image document

Developmental Reinforcement Learning through Sensorimotor Space Enlargement

Matthieu Zimmer , Yann Boniface , Alain Dutech
ICDL-EPIROB 2018 - 8th joint IEEE International Conference on Development and Learning and on Epigenetic Robotics, Sep 2018, Tokyo, Japan. pp.1-6, ⟨10.1109/DEVLRN.2018.8761021⟩
Communication dans un congrès hal-01876995v2

Développement autonome des comportements de base d'un agent

Alain Dutech , Olivier Buffet , François Charpillet
Conférence d'Apprentissage (CAp'04), Jun 2004, Montpellier, France
Communication dans un congrès inria-00000574v1

A Self-Made Agent Based on Action-Selection

Olivier Buffet , Alain Dutech
Sixth European Workshop on Reinforcement Learning - EWRL-6 2003, 2003, Nancy, France, pp.47-48
Communication dans un congrès inria-00099828v1
Image document

Computing the Equilibria of Bimatrix Games using Dominance Heuristics

Raghav Aras , Alain Dutech , François Charpillet
2006
Pré-publication, Document de travail hal-00118840v1
Image document

Apprentissage par Renforcement : Au delà des Processus Décisionnels de Markov (Vers la cognition incarnée)

Alain Dutech
Autre [cs.OH]. Université Nancy II, 2010
HDR tel-00549108v1
Image document

Exploration de la notion de méta-apprentissage

Matthieu Zimmer , Yann Boniface , Alain Dutech , Nicolas P. Rougier
[Rapport de recherche] Université de Lorraine, CNRS, Inria, LORIA, UMR 7503. 2012
Rapport hal-02268027v1

Simulation-Based Behavior Tracking of Pedestrians in Partially Observed Indoor Environments.

Arsène Fansi Tchango , Vincent Thomas , Olivier Buffet , Fabien Flacher , Alain Dutech
AAMAS 2014 - the thirteenth international conference on autonomous agents and multiagent systems, May 2014, Paris, France
Communication dans un congrès hal-01073434v1
Image document

Développement autonome des comportements de base d'un agent

Olivier Buffet , Alain Dutech , François Charpillet
Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, 2005, Apprentissage automatique, 19 (4-5), pp.603-632
Article dans une revue inria-00000572v1

Adaptive Combination of Behaviors in an Agent

Olivier Buffet , Alain Dutech , François Charpillet
European Conference on Artificial Intelligence - ECAI'02, 2002, Lyon, France, pp.48-52
Communication dans un congrès inria-00100766v1
Image document

Etude de différentes combinaisons de comportements adaptatives.

Olivier Buffet , Alain Dutech , François Charpillet
Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, 2006, Décision et planification dans l'incertain, 20 (2-3), pp.311-344
Article dans une revue inria-00119272v1
Image document

Quadratic Programming for Multi-Target Tracking

Raghav Aras , Alain Dutech , François Charpillet
AAMAS Worshop : Multi-agent Sequential Decision-Making in Uncertain Domains, May 2009, Budapest, Hungary. pp.4-10
Communication dans un congrès inria-00451638v1