Recherche - Archive ouverte HAL

88 résultats

	Pour les 88 documents Envoyer sur ORCID RSS ATOM Exporter BibTeX XML-TEI CSV RTF EndNote PDF HTML Export avancé	Page : Page précédente 1 2 3 Page suivante	triés par Pertinence Auteur A→Z Auteur Z→A Titre A→Z Titre Z→A Date de publication croissante Date de publication décroissante Date de dépôt croissante Date de dépôt décroissante

		Sur l'utilisation de politiques non-stationnaires pour les processus de décision Markoviens à horizon infini Bruno Scherrer , Boris Lesner JFPDA - 8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes - 2013, Jul 2013, Lille, France Communication dans un congrès hal-00921291v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Building Controllers for Tetris Christophe Thiery , Bruno Scherrer International Computer Games Association Journal, 2009, 32, pp.3-11 Article dans une revue inria-00418954v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Classification-based Policy Iteration with a Critic Victor Gabillon , Alessandro Lazaric , Mohammad Ghavamzadeh , Bruno Scherrer 2011 Rapport hal-00590972v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Guide pratique pour la conception de systèmes de culture légumiers économes en produits phytopharmaceutiques Marine Launais , Ludovic Bzdrenga , Vianney Estorgues , Vincent V. Faloya , Benoit B. Jeannequin , et al. 178 p., 2014 Ouvrages hal-02800645v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Simulations de carrières et retraites à points dans 3 cadres macro-économiques: modèle du gouvernement Philippe (âge-pivot bloqué), modèle du gouvernement Philippe corrigé (âge-pivot glissant), modèle Destinie2 (avec revalorisation de la fonction publique) Bruno Scherrer [Rapport de recherche] INRIA. 2020 Rapport hal-03137362v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Abstraction Pathologies In Markov Decision Processes Manel Tagorti , Bruno Scherrer , Olivier Buffet , Joerg Hoffmann ICAPS'13 workshop on Heuristics and Search for Domain-independent Planning (HSDIP), Jun 2013, Rome, Italy Communication dans un congrès hal-00907315v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Approximate dynamic programming for two-player zero-sum Markov games Julien Perolat , Bruno Scherrer , Bilal Piot , Olivier Pietquin International Conference on Machine Learning (ICML 2015), Jul 2015, Lille, France Communication dans un congrès hal-01153270v3	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Abstraction Pathologies In Markov Decision Processes Manel Tagorti , Bruno Scherrer , Olivier Buffet , Joerg Hoffmann 8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes, Jul 2013, Lille, France Communication dans un congrès hal-00907295v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Optimal control subsumes harmonic control Amine Boumaza , Bruno Scherrer [Research Report] 2006, pp.8 Rapport inria-00119243v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		On the Use of Non-Stationary Strategies for Solving Two-Player Zero-Sum Markov Games Julien Pérolat , Bilal Piot , Bruno Scherrer , Olivier Pietquin 19th International Conference on Artificial Intelligence and Statistics (AISTATS 2016), May 2016, Cadiz, Spain Communication dans un congrès hal-01291495v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		A Theory of Regularized Markov Decision Processes Matthieu Geist , Bruno Scherrer , Olivier Pietquin ICML 2019 - Thirty-sixth International Conference on Machine Learning, Jun 2019, Long Island, United States Communication dans un congrès hal-02273741v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Contributions algorithmiques au contrôle optimal stochastique à temps discret et horizon infini Bruno Scherrer Optimisation et contrôle [math.OC]. Université de Lorraine (Nancy), 2016 HDR tel-01400208v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Performance Bounds for Lambda Policy Iteration and Application to the Game of Tetris Bruno Scherrer Journal of Machine Learning Research, 2013, 14, pp.1175-1221 Article dans une revue hal-00759102v2	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Leverage the Average: an Analysis of KL Regularization in Reinforcement Learning Nino Vieillard , Tadashi Kozuno , Bruno Scherrer , Olivier Pietquin , Rémi Munos , et al. NeurIPS - 34th Conference on Neural Information Processing Systems, Dec 2020, Vancouver / Online, Canada Communication dans un congrès hal-03137351v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		A Dantzig Selector Approach to Temporal Difference Learning Matthieu Geist , Bruno Scherrer , Alessandro Lazaric , Mohammad Ghavamzadeh ICML-12, Jun 2012, Edinburgh, United Kingdom. pp.1399-1406 Communication dans un congrès hal-00749480v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Auto-organisation modulaire d'une architecture intelligente Bruno Scherrer Valgo numéro 01-02, La revue en ligne de l'Association des Connexionnistes en THèse, Association des Connexionnistes en THèse, Oct 2001, Montélimar, France, 8 p Communication dans un congrès inria-00099399v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Approximate Modified Policy Iteration Bruno Scherrer , Mohammad Ghavamzadeh , Victor Gabillon , Matthieu Geist 29th International Conference on Machine Learning - ICML 2012, Jun 2012, Edinburgh, United Kingdom Communication dans un congrès hal-00758882v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Momentum in Reinforcement Learning Nino Vieillard , Bruno Scherrer , Olivier Pietquin , Matthieu Geist AISTATS 2020 - 23rd International Conference on Artificial Intelligence and Statistics, Aug 2020, Palermo / Virtual, Italy Communication dans un congrès hal-03137343v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Navigation, fonctions harmoniques et contrôle optimal stochastique Amine Boumaza , Bruno Scherrer Cinquièmes Journées Nationales sur Processus Décisionnel de Markov et Intelligence Artificielle - PDMIA 2005, Jun 2005, Lille/France Communication dans un congrès inria-00000644v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Tight Performance Bounds for Approximate Modified Policy Iteration with Non-Stationary Policies Boris Lesner , Bruno Scherrer 2013 Pré-publication, Document de travail hal-00815996v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Convergence of Online and Approximate Multiple-Step Lookahead Policy Iteration Yonathan Efroni , Gal Dalal , Bruno Scherrer , Shie Mannor EWRL 2018 - 14th European workshop on Reinforcement Learning, Oct 2018, Lille, France Communication dans un congrès hal-01927977v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		On the rate of convergence and error bounds for LSTD(λ) Manel Tagorti , Bruno Scherrer ICML 2015, Jul 2015, Lille, France Communication dans un congrès hal-01186667v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Une étude comparative de quelques schémas d'approximation de type iterations sur les politiques Bruno Scherrer [Rapport de recherche] 2014 Rapport hal-00989991v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Modular self-organization for a long-living autonomous agent Bruno Scherrer [Intern report] A03-R-053 \|\| scherrer03b, 2003, 7 p Rapport inria-00107753v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Modular self-organization for a long-living autonomous agent Bruno Scherrer Eighteenth International Joint Conference on Artificial Intelligence - IJCAI'03, Aug 2003, Acapulco, Mexico Communication dans un congrès inria-00099717v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Embedded harmonic control for trajectory planning in large environments Cesar Torres-Huitzil , Bernard Girau , Amine Boumaza , Bruno Scherrer International Conference on ReConFigurable Computing and FPGAs - ReConFig 08, Dec 2008, Cancun, Mexico Communication dans un congrès inria-00337628v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Error Reducing Sampling in Reinforcement Learning Bruno Scherrer , Shie Mannor NIPS-08 Workshop on Model Uncertainty and Risk in Reinforcement Learning, Dec 2008, Whistler, Canada Communication dans un congrès inria-00337659v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Vitesse de convergence et borne d'erreur pour l'algorithme LSTD($\lambda$) Manel Tagorti , Bruno Scherrer JFPDA - 9èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes, May 2014, Liège, Belgique Communication dans un congrès hal-00990508v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Moindres carrés récursifs pour l'évaluation off-policy d'une politique avec traces d'éligibilité Bruno Scherrer , Matthieu Geist 6ème Journées Francophones de Planification, Décision et Apprentissage pour la conduite de systèmes - JFPDA 2011, Jun 2011, Rouen, France Communication dans un congrès hal-00644874v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		On the Use of Non-Stationary Policies for Stationary Infinite-Horizon Markov Decision Processes Bruno Scherrer , Boris Lesner NIPS 2012 - Neural Information Processing Systems, Dec 2012, South Lake Tahoe, United States Communication dans un congrès hal-00758809v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More

Filtrer vos résultats

Sur l'utilisation de politiques non-stationnaires pour les processus de décision Markoviens à horizon infini

Building Controllers for Tetris

Classification-based Policy Iteration with a Critic

Guide pratique pour la conception de systèmes de culture légumiers économes en produits phytopharmaceutiques

Simulations de carrières et retraites à points dans 3 cadres macro-économiques: modèle du gouvernement Philippe (âge-pivot bloqué), modèle du gouvernement Philippe corrigé (âge-pivot glissant), modèle Destinie2 (avec revalorisation de la fonction publique)

Abstraction Pathologies In Markov Decision Processes

Approximate dynamic programming for two-player zero-sum Markov games

Abstraction Pathologies In Markov Decision Processes

Optimal control subsumes harmonic control

On the Use of Non-Stationary Strategies for Solving Two-Player Zero-Sum Markov Games

A Theory of Regularized Markov Decision Processes

Contributions algorithmiques au contrôle optimal stochastique à temps discret et horizon infini

Performance Bounds for Lambda Policy Iteration and Application to the Game of Tetris

Leverage the Average: an Analysis of KL Regularization in Reinforcement Learning

A Dantzig Selector Approach to Temporal Difference Learning

Auto-organisation modulaire d'une architecture intelligente

Approximate Modified Policy Iteration

Momentum in Reinforcement Learning

Navigation, fonctions harmoniques et contrôle optimal stochastique

Tight Performance Bounds for Approximate Modified Policy Iteration with Non-Stationary Policies

Convergence of Online and Approximate Multiple-Step Lookahead Policy Iteration

On the rate of convergence and error bounds for LSTD(λ)

Une étude comparative de quelques schémas d'approximation de type iterations sur les politiques

Modular self-organization for a long-living autonomous agent

Modular self-organization for a long-living autonomous agent

Embedded harmonic control for trajectory planning in large environments

Error Reducing Sampling in Reinforcement Learning

Vitesse de convergence et borne d'erreur pour l'algorithme LSTD($\lambda$)

Moindres carrés récursifs pour l'évaluation off-policy d'une politique avec traces d'éligibilité

On the Use of Non-Stationary Policies for Stationary Infinite-Horizon Markov Decision Processes