ISBN/价格: | 978-7-302-59938-8:CNY139.00 |
---|---|
作品语种: | eng |
出版国别: | CN 110000 |
题名责任者项: | Rollout, policy iteration, and distributed reinforcement learning/.Dimitri P. Bertsekas/.(美) 德梅萃·P. 博赛卡斯著 |
版本项: | 影印版 |
出版发行项: | 北京:,清华大学出版社:,2022 |
载体形态项: | xii, 483页:;+图:;+24cm |
丛编项: | 国际知名大学原版教材——信息技术学科与电气工程学科系列 |
提要文摘: | 本书内容围绕强化学习中的策略迭代这一核心概念展开。全书共五章,主要内容:第1章为动态规划原理;第2章为策略前展与策略改进;第3章为专用策略前展算法;第4章为值和策略的学习;第5章为无限时间分布式和多智能体算法。 |
并列题名: | 策略前展、策略迭代与分布式强化学习 chi |
题名主题: | 机器学习 高等学校 教材 英文 |
索书号: | TP181/B89 |
中图分类: | TP181 |
个人名称等同: | 博赛卡斯 著 |
记录来源: | CN 浙江省新华书店集团公司 20220822 |