Articoli correlati a A Tutorial on Linear Function Approximators for Dynamic...

A Tutorial on Linear Function Approximators for Dynamic Programming and Reinforcement Learning - Brossura

 
9781601987600: A Tutorial on Linear Function Approximators for Dynamic Programming and Reinforcement Learning

Sinossi

A Markov Decision Process (MDP) is a natural framework for formulating sequential decision-making problems under uncertainty. In recent years, researchers have greatly advanced algorithms for learning and acting in MDPs. This book reviews such algorithms, beginning with well-known dynamic programming methods for solving MDPs such as policy iteration and value iteration, then describes approximate dynamic programming methods such as trajectory based value iteration, and finally moves to reinforcement learning methods such as Q-Learning, SARSA, and least-squares policy iteration. It describes algorithms in a unified framework, giving pseudocode together with memory and iteration complexity analysis for each. Empirical evaluations of these techniques, with four representations across four domains, provide insight into how these algorithms perform with various feature sets in terms of running time and performance. This tutorial provides practical guidance for researchers seeking to extend DP and RL techniques to larger domains through linear value function approximation. The practical algorithms and empirical successes outlined also form a guide for practitioners trying to weigh computational costs, accuracy requirements, and representational concerns. Decision making in large domains will always be challenging, but with the tools presented here this challenge is not insurmountable.

Le informazioni nella sezione "Riassunto" possono far riferimento a edizioni diverse di questo titolo.

  • EditoreTransatlantic Publishers
  • Data di pubblicazione2013
  • ISBN 10 1601987609
  • ISBN 13 9781601987600
  • RilegaturaCopertina flessibile
  • LinguaInglese
  • Numero di pagine92

Compra usato

Condizioni: molto buono
Unused, some outer edges have minor...
Visualizza questo articolo

EUR 18,98 per la spedizione da Regno Unito a Italia

Destinazione, tempi e costi

EUR 2,00 per la spedizione da U.S.A. a Italia

Destinazione, tempi e costi

Risultati della ricerca per A Tutorial on Linear Function Approximators for Dynamic...

Foto dell'editore

Geramifard, Alborz; Walsh, Thomas J; Stefanie, Tellex; Chowdhary, Girish; Roy, Nicholas; How, Jonathan P
Editore: Now Publishers, 2013
ISBN 10: 1601987609 ISBN 13: 9781601987600
Antico o usato Brossura

Da: Hay-on-Wye Booksellers, Hay-on-Wye, HEREF, Regno Unito

Valutazione del venditore 5 su 5 stelle 5 stelle, Maggiori informazioni sulle valutazioni dei venditori

Condizione: Very Good. Unused, some outer edges have minor scuffs, cover has light scratches, some outer pages have marks from shelf wear, book content is in like new condition. Codice articolo 101703-7

Contatta il venditore

Compra usato

EUR 30,85
Convertire valuta
Spese di spedizione: EUR 18,98
Da: Regno Unito a: Italia
Destinazione, tempi e costi

Quantità: 1 disponibili

Aggiungi al carrello

Foto dell'editore

Alborz Geramifard
Editore: Now Publishers, 2013
ISBN 10: 1601987609 ISBN 13: 9781601987600
Nuovo PAP
Print on Demand

Da: PBShop.store US, Wood Dale, IL, U.S.A.

Valutazione del venditore 5 su 5 stelle 5 stelle, Maggiori informazioni sulle valutazioni dei venditori

PAP. Condizione: New. New Book. Shipped from UK. THIS BOOK IS PRINTED ON DEMAND. Established seller since 2000. Codice articolo L0-9781601987600

Contatta il venditore

Compra nuovo

EUR 69,86
Convertire valuta
Spese di spedizione: EUR 2,00
Da: U.S.A. a: Italia
Destinazione, tempi e costi

Quantità: Più di 20 disponibili

Aggiungi al carrello

Foto dell'editore

Alborz Geramifard
Editore: Now Publishers, 2013
ISBN 10: 1601987609 ISBN 13: 9781601987600
Nuovo PAP
Print on Demand

Da: PBShop.store UK, Fairford, GLOS, Regno Unito

Valutazione del venditore 4 su 5 stelle 4 stelle, Maggiori informazioni sulle valutazioni dei venditori

PAP. Condizione: New. New Book. Delivered from our UK warehouse in 4 to 14 business days. THIS BOOK IS PRINTED ON DEMAND. Established seller since 2000. Codice articolo L0-9781601987600

Contatta il venditore

Compra nuovo

EUR 67,41
Convertire valuta
Spese di spedizione: EUR 5,98
Da: Regno Unito a: Italia
Destinazione, tempi e costi

Quantità: Più di 20 disponibili

Aggiungi al carrello

Foto dell'editore

Geramifard, Alborz; Walsh, Thomas J; Stefanie, Tellex; Chowdhary, Girish; Roy, Nicholas; How, Jonathan P
Editore: Now Publishers, 2013
ISBN 10: 1601987609 ISBN 13: 9781601987600
Nuovo Brossura

Da: Ria Christie Collections, Uxbridge, Regno Unito

Valutazione del venditore 5 su 5 stelle 5 stelle, Maggiori informazioni sulle valutazioni dei venditori

Condizione: New. In. Codice articolo ria9781601987600_new

Contatta il venditore

Compra nuovo

EUR 64,80
Convertire valuta
Spese di spedizione: EUR 10,66
Da: Regno Unito a: Italia
Destinazione, tempi e costi

Quantità: Più di 20 disponibili

Aggiungi al carrello

Immagini fornite dal venditore

Geramifard, Alborz|Walsh, Thomas J.|Tellex, Stefanie
Editore: Now Publishers Inc, 2013
ISBN 10: 1601987609 ISBN 13: 9781601987600
Nuovo Brossura

Da: moluna, Greven, Germania

Valutazione del venditore 5 su 5 stelle 5 stelle, Maggiori informazioni sulle valutazioni dei venditori

Condizione: New. Inhaltsverzeichnis1: Introduction 2: Dynamic Programming and Reinforcement Learning 3: Representations 4: Empirical Results 5: Summary. Acknowledgements. References.KlappentextA Markov Decision Process (. Codice articolo 4231663

Contatta il venditore

Compra nuovo

EUR 72,02
Convertire valuta
Spese di spedizione: EUR 9,70
Da: Germania a: Italia
Destinazione, tempi e costi

Quantità: Più di 20 disponibili

Aggiungi al carrello

Foto dell'editore

Alborz Geramifard
Editore: now publishers Inc, 2013
ISBN 10: 1601987609 ISBN 13: 9781601987600
Nuovo Paperback / softback
Print on Demand

Da: THE SAINT BOOKSTORE, Southport, Regno Unito

Valutazione del venditore 5 su 5 stelle 5 stelle, Maggiori informazioni sulle valutazioni dei venditori

Paperback / softback. Condizione: New. This item is printed on demand. New copy - Usually dispatched within 5-9 working days 142. Codice articolo C9781601987600

Contatta il venditore

Compra nuovo

EUR 75,71
Convertire valuta
Spese di spedizione: EUR 6,68
Da: Regno Unito a: Italia
Destinazione, tempi e costi

Quantità: Più di 20 disponibili

Aggiungi al carrello

Foto dell'editore

Geramifard, Alborz
ISBN 10: 1601987609 ISBN 13: 9781601987600
Nuovo PF

Da: Chiron Media, Wallingford, Regno Unito

Valutazione del venditore 5 su 5 stelle 5 stelle, Maggiori informazioni sulle valutazioni dei venditori

PF. Condizione: New. Codice articolo 6666-IUK-9781601987600

Contatta il venditore

Compra nuovo

EUR 59,18
Convertire valuta
Spese di spedizione: EUR 23,71
Da: Regno Unito a: Italia
Destinazione, tempi e costi

Quantità: 10 disponibili

Aggiungi al carrello

Foto dell'editore

Alborz Geramifard
Editore: now publishers Inc, 2014
ISBN 10: 1601987609 ISBN 13: 9781601987600
Nuovo Paperback

Da: Revaluation Books, Exeter, Regno Unito

Valutazione del venditore 5 su 5 stelle 5 stelle, Maggiori informazioni sulle valutazioni dei venditori

Paperback. Condizione: Brand New. 92 pages. 8.98x5.98x0.16 inches. In Stock. Codice articolo x-1601987609

Contatta il venditore

Compra nuovo

EUR 88,39
Convertire valuta
Spese di spedizione: EUR 11,86
Da: Regno Unito a: Italia
Destinazione, tempi e costi

Quantità: 2 disponibili

Aggiungi al carrello

Immagini fornite dal venditore

Alborz Geramifard
Editore: Now Publishers Inc, 2013
ISBN 10: 1601987609 ISBN 13: 9781601987600
Nuovo Taschenbuch
Print on Demand

Da: AHA-BUCH GmbH, Einbeck, Germania

Valutazione del venditore 5 su 5 stelle 5 stelle, Maggiori informazioni sulle valutazioni dei venditori

Taschenbuch. Condizione: Neu. nach der Bestellung gedruckt Neuware - Printed after ordering - A Markov Decision Process (MDP) is a natural framework for formulating sequential decision-making problems under uncertainty. In recent years, researchers have greatly advanced algorithms for learning and acting in MDPs. This book reviews such algorithms, beginning with well-known dynamic programming methods for solving MDPs such as policy iteration and value iteration, then describes approximate dynamic programming methods such as trajectory based value iteration, and finally moves to reinforcement learning methods such as Q-Learning, SARSA, and least-squares policy iteration. It describes algorithms in a unified framework, giving pseudocode together with memory and iteration complexity analysis for each. Empirical evaluations of these techniques, with four representations across four domains, provide insight into how these algorithms perform with various feature sets in terms of running time and performance.This tutorial provides practical guidance for researchers seeking to extend DP and RL techniques to larger domains through linear value function approximation. The practical algorithms and empirical successes outlined also form a guide for practitioners trying to weigh computational costs, accuracy requirements, and representational concerns. Decision making in large domains will always be challenging, but with the tools presented here this challenge is not insurmountable. Codice articolo 9781601987600

Contatta il venditore

Compra nuovo

EUR 96,14
Convertire valuta
Spese di spedizione: EUR 14,99
Da: Germania a: Italia
Destinazione, tempi e costi

Quantità: 1 disponibili

Aggiungi al carrello

Foto dell'editore

Geramifard, Alborz; Walsh, Thomas J; Stefanie, Tellex; Chowdhary, Girish; Roy, Nicholas; How, Jonathan P
Editore: Now Publishers, 2013
ISBN 10: 1601987609 ISBN 13: 9781601987600
Nuovo Brossura

Da: Lucky's Textbooks, Dallas, TX, U.S.A.

Valutazione del venditore 5 su 5 stelle 5 stelle, Maggiori informazioni sulle valutazioni dei venditori

Condizione: New. Codice articolo ABLIING23Mar2811580106163

Contatta il venditore

Compra nuovo

EUR 61,39
Convertire valuta
Spese di spedizione: EUR 67,07
Da: U.S.A. a: Italia
Destinazione, tempi e costi

Quantità: Più di 20 disponibili

Aggiungi al carrello

Vedi altre 2 copie di questo libro

Vedi tutti i risultati per questo libro