Filtrer vos résultats
- 44
- 26
- 45
- 11
- 6
- 3
- 3
- 1
- 1
- 3
- 1
- 68
- 5
- 4
- 4
- 3
- 1
- 1
- 1
- 4
- 1
- 1
- 4
- 5
- 5
- 1
- 4
- 3
- 7
- 3
- 2
- 4
- 4
- 3
- 5
- 6
- 2
- 4
- 1
- 47
- 23
- 69
- 44
- 22
- 4
- 3
- 3
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 70
- 23
- 22
- 13
- 6
- 4
- 4
- 4
- 4
- 4
- 3
- 3
- 3
- 3
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
70 résultats
Apprentissage par renforcement pour la conception de Systèmes Multi-Agents RéactifsJournées Francophones sur les Systèmes Multi-Agents 2003 - JFSMA'03, 2003, Hammamet, Tunise, pp.219-231
Communication dans un congrès
inria-00099564v1
|
|||
Multi-Agent Systems by Incremental Gradient Reinforcement Learning.17th International Joint Conference on Artificial Intelligence, 2001, Seattle, WA, USA, pp.833--838
Communication dans un congrès
inria-00101090v1
|
|||
|
QUALCOM : une expérience sur la qualification des comportements d’une lampe robotiqueTechniques et culture, 2019, Varia, ⟨10.4000/tc.10771⟩
Article dans une revue
hal-02075467v1
|
||
Incremental reinforcement learning for designing multi-agent systems5th International Conference on Autonomous Agents, Jun 2001, Montréal, Canada, 8 p
Communication dans un congrès
inria-00100538v1
|
|||
Learning to weigh basic behaviors in Scalable AgentsFirst International Joint Conference on Autonomous Agents and Multiagent Systems - AAMAS 2002, 2002, Bologna, Italy, pp.1264-1265
Communication dans un congrès
inria-00100765v1
|
|||
|
Réservoir computing" et Apprentissage par Renforcement DéveloppementalJournées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 13 p
Communication dans un congrès
hal-00736316v1
|
||
|
Online Learning with Noise: A Kernel-Based Policy-Gradient ApproachConférence Française de Neurosciences Computationnelles - NeuroComp 2010, Oct 2010, Lyon, France
Communication dans un congrès
inria-00517006v1
|
||
|
Apprentissage par renforcement et jeux stochastiques à information incomplèteCinquièmes Journées Nationales sur Processus Décisionnel de Markov et Intelligence Artificielle - PDMIA'05, Jun 2005, Lille/France
Communication dans un congrès
inria-00000212v1
|
||
|
Apprentissage par Renforcement Développemental en Robotique AutonomeConférence d'Apprentissage - CAP 2011, May 2011, Chambéry, France
Communication dans un congrès
inria-00633426v1
|
||
|
Proteus, des web services pour les systèmes de maintenanceNouvelles Technologie de la Répartition - NOTERE'04, Concordia University, 2004, Saidia/Maroc, pp.163-178
Communication dans un congrès
inria-00107792v1
|
||
|
Toward a data efficient neural actor-criticEWRL 2016 - The 13th European Workshop on Reinforcement Learning, Dec 2016, Barcelona, Spain
Communication dans un congrès
hal-01413885v1
|
||
|
Exploring Sensitization in the Context of Extending the Behavior of an Artificial AgentInternational Conference on Simulation of Adaptive Behavior (SAB22), Sep 2022, Cergy-Pontoise, France. pp.15-27, ⟨10.1007/978-3-031-16770-6_2⟩
Communication dans un congrès
hal-04031636v1
|
||
How do we make sense of a robot’s behavior? An experimental case studyIACS4- 4th Conference of the International Association for Cognitive Semiotics, KU Leuven; RWTH Aachen University, Jun 2022, Virtual Conference, Germany
Communication dans un congrès
hal-03698516v1
|
|||
Towards the Usage of Advanced Behavioral Simulations for Simultaneous Tracking and Activity Recognition.STAIRS 2014 - Proceedings of the Seventh European Starting AI Researcher Symposium, Aug 2014, Pragues, Czech Republic
Communication dans un congrès
hal-01073427v1
|
|||
|
Self-organizing developmental reinforcement learningInternational Conference on Simulated Animal Behavior, 2012, Odense, Denmark
Communication dans un congrès
hal-00705350v1
|
||
|
Reinforcement Learning Approaches to Instrumental Contingency Degradation in RatsConférence Française de Neurosciences Computationnelles - NeuroComp 2010, Oct 2010, Lyon, France
Communication dans un congrès
inria-00517011v1
|
||
Processus décisionnels de Markov partiellement observablesO. Sigaud and O. Buffet. Processus décisionnels de Markov en intelligence artificielle, 1 - principes généraux et applications, Lavoisier - Hermes Science Publications, pp.89-133, 2008, IC2 - informatique et systèmes d'information, 978-2746220577
Chapitre d'ouvrage
inria-00335158v1
|
|||
|
An investigation into Mathematical Programming for Finite Horizon Decentralized POMDPsJournal of Artificial Intelligence Research, 2010, 37, pp.329-396. ⟨10.1613/jair.2915⟩
Article dans une revue
inria-00439627v1
|
||
|
Émergence et apprentissage d'information dans un modèle multimodal de cartes CNFT impulsionnelles2009
Pré-publication, Document de travail
hal-00802908v1
|
||
|
Developmental Reinforcement Learning through Sensorimotor Space EnlargementICDL-EPIROB 2018 - 8th joint IEEE International Conference on Development and Learning and on Epigenetic Robotics, Sep 2018, Tokyo, Japan. pp.1-6, ⟨10.1109/DEVLRN.2018.8761021⟩
Communication dans un congrès
hal-01876995v2
|
||
Développement autonome des comportements de base d'un agentConférence d'Apprentissage (CAp'04), Jun 2004, Montpellier, France
Communication dans un congrès
inria-00000574v1
|
|||
A Self-Made Agent Based on Action-SelectionSixth European Workshop on Reinforcement Learning - EWRL-6 2003, 2003, Nancy, France, pp.47-48
Communication dans un congrès
inria-00099828v1
|
|||
|
Computing the Equilibria of Bimatrix Games using Dominance Heuristics2006
Pré-publication, Document de travail
hal-00118840v1
|
||
|
Apprentissage par Renforcement : Au delà des Processus Décisionnels de Markov (Vers la cognition incarnée)Autre [cs.OH]. Université Nancy II, 2010
HDR
tel-00549108v1
|
||
|
Exploration de la notion de méta-apprentissage[Rapport de recherche] Université de Lorraine, CNRS, Inria, LORIA, UMR 7503. 2012
Rapport
hal-02268027v1
|
||
Simulation-Based Behavior Tracking of Pedestrians in Partially Observed Indoor Environments.AAMAS 2014 - the thirteenth international conference on autonomous agents and multiagent systems, May 2014, Paris, France
Communication dans un congrès
hal-01073434v1
|
|||
|
Développement autonome des comportements de base d'un agentRevue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, 2005, Apprentissage automatique, 19 (4-5), pp.603-632
Article dans une revue
inria-00000572v1
|
||
Adaptive Combination of Behaviors in an AgentEuropean Conference on Artificial Intelligence - ECAI'02, 2002, Lyon, France, pp.48-52
Communication dans un congrès
inria-00100766v1
|
|||
|
Etude de différentes combinaisons de comportements adaptatives.Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, 2006, Décision et planification dans l'incertain, 20 (2-3), pp.311-344
Article dans une revue
inria-00119272v1
|
||
|
Quadratic Programming for Multi-Target TrackingAAMAS Worshop : Multi-agent Sequential Decision-Making in Uncertain Domains, May 2009, Budapest, Hungary. pp.4-10
Communication dans un congrès
inria-00451638v1
|