Nombre de documents

58

CV de Alain Dutech


Communication dans un congrès39 documents

  • Matthieu Zimmer, Yann Boniface, Alain Dutech. Neural Fitted Actor-Critic. European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning (ESANN 2016), Apr 2016, Bruges, Belgium. ESANN 2016 proceedings, <https://www.elen.ucl.ac.be>. <hal-01350651>
  • Matthieu Zimmer, Yann Boniface, Alain Dutech. Toward a data efficient neural actor-critic. European Workshop on Reinforcement Learning, Dec 2016, Barcelona, Spain. 2016, European Workshop on Reinforcement Learning. <https://ewrl.wordpress.com/>. <hal-01413885>
  • Matthieu Zimmer, Yann Boniface, Alain Dutech. Off-Policy Neural Fitted Actor-Critic. Deep Reinforcement Learning Workshop, NIPS 2016, Dec 2016, Barcelona, Spain. Deep Reinforcement Learning Workshop, NIPS, 2016, <https://sites.google.com/site/deeprlnips2016/>. <hal-01413886>
  • Matthieu Zimmer, Yann Boniface, Alain Dutech. Vers des architectures acteur-critique neuronales efficaces en données. Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes, Jul 2016, Grenoble, France. 2016, <http://jfpda2016.imag.fr/>. <hal-01344905>
  • Arsène Fansi Tchango, Vincent Thomas, Olivier Buffet, Fabien Flacher, Alain Dutech. Simultaneous Tracking and Activity Recognition (STAR) using Advanced Agent-Based Behavioral Simulations.. ECAI - Proceedings of the Twenty-first European Conference on Artificial Intelligence, Aug 2014, Pragues, Czech Republic. 2014. <hal-01073424>
  • Arsène Fansi Tchango, Vincent Thomas, Olivier Buffet, Fabien Flacher, Alain Dutech. Towards the Usage of Advanced Behavioral Simulations for Simultaneous Tracking and Activity Recognition.. STAIRS 2014 - Proceedings of the Seventh European Starting AI Researcher Symposium, Aug 2014, Pragues, Czech Republic. 2014. <hal-01073427>
  • Arsène Fansi Tchango, Vincent Thomas, Olivier Buffet, Fabien Flacher, Alain Dutech. Tracking Multiple Interacting Targets Using a Joint Probabilistic Data Association Filter. FUSION 2014 - the 17th International Conference on Information Fusion, Jul 2014, Salamanca, Spain. 2014. <hal-01073429>
  • Arsène Fansi Tchango, Vincent Thomas, Olivier Buffet, Fabien Flacher, Alain Dutech. Simulation-Based Behavior Tracking of Pedestrians in Partially Observed Indoor Environments.. AAMAS 2014 - the thirteenth international conference on autonomous agents and multiagent systems, May 2014, Paris, France. 2014. <hal-01073434>
  • Alain Dutech. "Réservoir computing" et Apprentissage par Renforcement Développemental. Olivier Buffet. Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 13 p, 2012. <hal-00736316>
  • Alain Dutech. Self-organizing developmental reinforcement learning. International Conference on Simulated Animal Behavior, 2012, Odense, Denmark. 2012. <hal-00705350>
  • Luc Sarzyniec, Olivier Buffet, Alain Dutech. Apprentissage par Renforcement Développemental en Robotique Autonome. Conférence d'Apprentissage - CAP 2011, May 2011, Chambéry, France. 2011. <inria-00633426>
  • Alain Dutech. Dynamic reservoir for developmental reinforcement learning. Taras Kowaliw and Nicolas Bredeche and René Doursat. Workshop on Development and Learning in Artificial Neural Networks (DevLeaNN), Oct 2011, Paris, France. pp.37-40, 2011, Proceedings of DevLeaNN A Workshop on Development and Learning in Artificial Neural Networks. <inria-00633433>
  • Alain Dutech, Etienne Coutureau, Alain Marchand. Reinforcement Learning Approaches to Instrumental Contingency Degradation in Rats. Conférence Française de Neurosciences Computationnelles - NeuroComp 2010, Oct 2010, Lyon, France. 2010. <inria-00517011>
  • Emmanuel Daucé, Alain Dutech. Online Learning with Noise: A Kernel-Based Policy-Gradient Approach. Conférence Française de Neurosciences Computationnelles - NeuroComp 2010, Oct 2010, Lyon, France. 2010. <inria-00517006>
  • Emmanuel Daucé, Alain Dutech. Cartes topographiques neuronales pour l'apprentissage par renforcement sur des problèmes de contrôle non-linéaire. 10e Colloque Africain sur la Recherche en Informatique et en Mathématiques Appliquées, Oct 2010, Yamoussoukro, Côte d’Ivoire. pp.9 P., 2010. <inria-00494164>
  • Raghav Aras, Alain Dutech, François Charpillet. Quadratic Programming for Multi-Target Tracking. AAMAS Worshop : Multi-agent Sequential Decision-Making in Uncertain Domains, May 2009, Budapest, Hungary. pp.4-10, 2009. <inria-00451638>
  • Raghav Aras, Alain Dutech, François Charpillet. Mixed Integer Linear Programming For Exact Finite-Horizon Planning In Decentralized Pomdps. The International Conference on Automated Planning and Scheduling - ICAPS 2007, Sep 2008, Providence / Rhode Island, United States. pp.18-25, 2007. <inria-00163372>
  • Raghav Aras, Alain Dutech, François Charpillet. Une méthode de programmation linéaire mixte pour les POMDP décentralisé à horizon fini. 2e Journées Francophones Planification, Décision, Apprentissage pour la conduite de systèmes - JFPDA 2007, Jul 2007, Grenoble, France. 2007, JFPDA 2007. <inria-00162469>
  • Alain Dutech. Modèles stochastiques de la prise de décision collective. Colloque de l'Association pour la Recherche Cognitive - ARCo'07 : Cognition – Complexité – Collectif, Nov 2007, Nancy, France. pp.167-176, 2007. <inria-00179596>
  • Raghav Aras, Alain Dutech, François Charpillet. Efficient Learning in Games. Conférence Francophone sur l'Apprentissage Automatique - CAP 2006, 2006, Trégastel, France. 2006. <inria-00102188>
  • Alain Dutech, Raghav Aras, François Charpillet. Apprentissage par Renforcement et Théorie des Jeux pour la coordination de Systèmes Multi-Agents. Colloque Africain sur la Recherche en Informatique - CARI 2006, 2006, Cotonou/Bénin, 2006. <inria-00102192>
  • Raghav Aras, Alain Dutech, François Charpillet. Cooperation in stochastic games through communication. 4th International Joint Conference on Autonomous Agents and Multiagent Systems - AAMAS'05, Jul 2005, Utrecht/ The Netherlands, ACP Press, pp.1197 - 1198, 2005, International Conference on Autonomous Agents - Proceedings of the fourth international joint conference on Autonomous agents and multiagent systems. <10.1145/1082473.1082691>. <inria-00000208>
  • Raghav Aras, Alain Dutech. Apprentissage par renforcement et jeux stochastiques à information incomplète. Cinquièmes Journées Nationales sur Processus Décisionnel de Markov et Intelligence Artificielle - PDMIA'05, Jun 2005, Lille/France, 2005. <inria-00000212>
  • Xavier Rebeuf, Nicolas Blanc, François Charpillet, Denis Chevé, Alain Dutech, et al.. Proteus, des web services pour les systèmes de maintenance. Rachida Dssouli. Nouvelles Technologie de la Répartition - NOTERE'04, 2004, Saidia/Maroc, pp.163-178, 2004. <inria-00107792>
  • Olivier Buffet, Alain Dutech, François Charpillet. Self-Growth of Basic Behaviors in an Action Selection Based Agent. Stefan Schaal, Auke Jan Ijspeert, Aude Billard, Sethu Vijayakumar, John Hallam and Jean-Arcady Meyer. Eighth International Conference on Simulation of Adaptive Behavior (SAB'04), Jul 2004, Los Angeles, CA, USA, MIT Press, pp.223-232, 2004, From Animals to Animats 8: Proceedings of the Eighth International Conference on Simulation of Adaptive Behavior. <inria-00000573>
  • Alain Dutech, Olivier Buffet, François Charpillet. Développement autonome des comportements de base d'un agent. Conférence d'Apprentissage (CAp'04), Jun 2004, Montpellier, France, 2004, Actes de la Conférence d'Apprentissage. <inria-00000574>
  • Raghav Aras, Alain Dutech, François Charpillet. Cooperation through communication in decentralized Markov games. International Conference on Advances in Intelligent Systems - Theory and Applications - AISTA'2004, Nov 2004, Luxembourg-Kirchberg/Luxembourg, 2004. <inria-00000210>
  • Raghav Aras, Alain Dutech, François Charpillet. Stigmergy in multi-agent reinforcement learning. Fourth International Conference on Hybrid Intelligent Systems - HIS'04, Dec 2004, Kitakyushu/Japan, IEEE, pp.468-469, 2004, <10.1109/ICHIS.2004.87>. <inria-00000209>
  • Alain Dutech, Olivier Buffet, François Charpillet. Apprentissage par renforcement pour la conception de Systèmes Multi-Agents Réactifs. Journées Francophones sur les Systèmes Multi-Agents 2003 - JFSMA'03, 2003, Hammamet, Tunise, Hermès, pp.219-231, 2003. <inria-00099564>
  • Olivier Buffet, Alain Dutech. A Self-Made Agent Based on Action-Selection. Sixth European Workshop on Reinforcement Learning - EWRL-6 2003, 2003, Nancy, France, pp.47-48, 2003. <inria-00099828>
  • Olivier Buffet, Alain Dutech, François Charpillet. Automatic Generation of an Agent's Basic Behaviors. Rosenschein, Sandholm, Wooldridge and Yokoo. Second International Joint Conference on Autonomous Agents and Multi-Agent Systems - AAMAS'03, 2003, Melbourne, Victoria, Australie, ACM press, pp.875-882, 2003. <inria-00099817>
  • Alain Dutech, Olivier Buffet. Proceedings of the Sixth European Workshop on Reinforcement Learning. Sixth European Workshop on Reinforcement Learning - EWRL-6, 2003, Nancy, France, INRIA, 50 p, 2003. <inria-00099829>
  • Olivier Buffet, Alain Dutech, François Charpillet. Adaptive Combination of Behaviors in an Agent. European Conference on Artificial Intelligence - ECAI'02, 2002, Lyon, France, pp.48-52, 2002. <inria-00100766>
  • Olivier Buffet, Alain Dutech, François Charpillet. Learning to weigh basic behaviors in Scalable Agents. First International Joint Conference on Autonomous Agents and Multiagent Systems - AAMAS 2002, 2002, Bologna, Italy, 3, pp.1264-1265, 2002. <inria-00100765>
  • Alain Dutech, Bruno Scherrer. Learning to use contextual information for solving POMDP. European Workshop on Reinforcement Learning - EWRL-5, Oct 2001, Utrecht, The Netherlands, 2 p, 2001. <inria-00100539>
  • Olivier Buffet, François Charpillet, Alain Dutech. Incremental reinforcement learning for designing multi-agent systems. 5th International Conference on Autonomous Agents, Jun 2001, Montréal, Canada, 8 p, 2001. <inria-00100538>
  • Olivier Buffet, Alain Dutech. Looking for Scalable Agents. European Workshop On Reinforcement Learning, 2001, Utrecht, The Netherlands, 2 p, 2001. <inria-00100537>
  • Alain Dutech, Olivier Buffet, François Charpillet. Multi-Agent Systems by Incremental Gradient Reinforcement Learning.. 17th International Joint Conference on Artificial Intelligence, 2001, Seattle, WA, USA, 2, pp.833--838, 2001. <inria-00101090>
  • Alain Dutech. Solving POMDPs using selected past events. European Conference on Artificial Intelligence, 2000, Berlin, Germany, 2000. <inria-00099378>

Rapport4 documents

  • Marc Legendre, Kévin Hollard, Olivier Buffet, Alain Dutech. MineSweeper: Where to Probe?. [Research Report] RR-8041, INRIA. 2012, pp.26. <hal-00723550>
  • Raghav Aras, Alain Dutech. An investigation into Mathematical Programming for Finite Horizon Decentralized POMDPs. [Research Report] RR-7066, INRIA. 2009. <inria-00424394v3>
  • Raghav Aras, Alain Dutech, François Charpillet. Using linear programming duality for solving finite horizon Dec-POMDPs. [Technical Report] RR-6641, INRIA. 2008, pp.27. <inria-00320645>
  • Olivier Buffet, Alain Dutech, François Charpillet. Etude de différentes combinaisons de comportements adaptatives au sein d'un agent.. [Interne] A03-R-342 || buffet03d, 2003, 40 p. <inria-00099773>

Pré-publication, Document de travail3 documents

  • Emmanuel Daucé, Alain Dutech. Inverse Kinematics On-line Learning: a Kernel-Based Policy-Gradient approach. 2010. <inria-00520960>
  • Selma Belgacem, Yann Boniface, Alain Dutech. Émergence et apprentissage d'information dans un modèle multimodal de cartes CNFT impulsionnelles. MS-CNFT_Selma-Belgacem. 2009. <hal-00802908>
  • Raghav Aras, Alain Dutech, François Charpillet. Computing the Equilibria of Bimatrix Games using Dominance Heuristics. 2006. <hal-00118840>

Article dans une revue8 documents

  • Simon Gay, Alain Mille, Olivier Georgeon, Alain Dutech. Autonomous construction and exploitation of a spatial memory by a self-motivated agent. Cognitive Systems Research, Elsevier, 2016, 41, pp.1-35. <http://www.sciencedirect.com/science/article/pii/S1389041715300346>. <10.1016/j.cogsys.2016.07.004>. <hal-01371877>
  • Alain Dutech, Bruno Scherrer, Christophe Thiery. La carotte et le bâton... et Tetris. Images des Mathématiques, CNRS, 2013. <hal-00922142>
  • Alain Dutech, Etienne Coutureau, Alain Marchand. A reinforcement learning approach to instrumental contingency degradation in rats. Journal of Physiology - Paris, Elsevier, 2011, Computational Neuroscience: Neurocomp 2010, 105 (1-3), pp.36-44. <http://www.sciencedirect.com/science/article/pii/S0928425711000209>. <10.1016/j.jphysparis.2011.07.017>. <hal-00642715>
  • Raghav Aras, Alain Dutech. An investigation into Mathematical Programming for Finite Horizon Decentralized POMDPs. Journal of Artificial Intelligence Research, Association for the Advancement of Artificial Intelligence, 2010, 37, pp.329-396. <http://www.jair.org/media/2915/live-2915-4898-jair.pdf>. <10.1613/jair.2915>. <inria-00439627>
  • Olivier Buffet, Alain Dutech, François Charpillet. Shaping Multi-Agent Systems with Gradient Reinforcement Learning. Autonomous Agents and Multi-Agent Systems, Springer Verlag, 2007, 15 (2), pp.197--220. <10.1007/s10458-006-9010-5>. <inria-00118983>
  • Olivier Buffet, Alain Dutech, François Charpillet. Etude de différentes combinaisons de comportements adaptatives.. Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, Lavoisier, 2006, Décision et planification dans l'incertain, 20 (2-3), pp.311-344. <inria-00119272>
  • Olivier Buffet, Alain Dutech, François Charpillet. Développement autonome des comportements de base d'un agent. Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, Lavoisier, 2005, Apprentissage automatique, 19 (4-5), pp.603-632. <inria-00000572>
  • Alain Dutech, Manuel Samuelides. Apprentissage par renforcement pour les processus décisionnels de Markov partiellement observés.. Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, Lavoisier, 2003, 17 (4), pp.559-589. <inria-00099563>

Chapitre d'ouvrage3 documents

  • Alain Dutech. L'intelligence du geste robotique. Michel Guérin. Le Geste entre émergence et apparence, Presses Universitaires de Provence (PUP), 2014, 978-2-85399-953-3. <hal-01260210>
  • Alain Dutech, Bruno Scherrer. Partially Observable Markov Decision Processes. Olivier Sigaud and Olivier Buffet. Markov Decision Processes in Artificial Intelligence, ISTE Ltd and John Wiley & Sons Inc, 2010, inria-00439123. <inria-00439123>
  • Alain Dutech, Bruno Scherrer. Processus décisionnels de Markov partiellement observables. O. Sigaud and O. Buffet. Processus décisionnels de Markov en intelligence artificielle, 1 - principes généraux et applications, Lavoisier - Hermes Science Publications, pp.89-133, 2008, IC2 - informatique et systèmes d'information, 978-2746220577. <inria-00335158>

HDR1 document

  • Alain Dutech. Apprentissage par Renforcement : Au delà des Processus Décisionnels de Markov (Vers la cognition incarnée). Autre [cs.OH]. Université Nancy II, 2010. <tel-00549108>