Foundations of Deep Reinforcement Learning: Theory and Practice in Python, 1st edition
BRAND: PEARSON
Publisher: | Addison-Wesley Professional |
Author: | Laura Graesser; Wah Loon Keng |
Edition: | (December 5, 2019) © 2020 |
eBook ISBN: | 9780135172483 |
Print ISBN: | 9780135172384 |
Type: | 1 Year Subscription. Dành cho Cá nhân |
eBook edition. 1 Year Subscription. Dành cho Cá nhân | Trường ĐH, Nhóm, Thư Viện: Gọi 0915920514 để báo giá Pearson, Vital Source eBook hoặc mua Sách In
See what in the box
Mô tả sản phẩm
Giới thiệu đương đại về Học tập tăng cường sâu kết hợp lý thuyết và thực hành
Học tăng cường sâu (deep RL) kết hợp học sâu và học tăng cường, trong đó các tác nhân nhân tạo học cách giải quyết các vấn đề ra quyết định tuần tự. Trong thập kỷ qua, deep RL đã đạt được những kết quả đáng chú ý về nhiều vấn đề, từ các trò chơi đơn và nhiều người chơi – chẳng hạn như cờ vây, trò chơi Atari và DotA 2 – cho đến chế tạo robot.
Nền tảng của Học tăng cường sâu là phần giới thiệu về RL sâu kết hợp độc đáo cả lý thuyết và cách thực hiện. Nó bắt đầu bằng trực giác, sau đó giải thích cẩn thận lý thuyết về thuật toán RL sâu, thảo luận về việc triển khai trong thư viện phần mềm đồng hành SLM Lab và kết thúc bằng các chi tiết thực tế để giúp RL sâu hoạt động.
Hướng dẫn này lý tưởng cho cả sinh viên khoa học máy tính và kỹ sư phần mềm đã quen thuộc với các khái niệm học máy cơ bản và có hiểu biết làm việc về Python.
Hiểu từng khía cạnh chính của một vấn đề RL sâu sắc
Khám phá các thuật toán dựa trên chính sách và giá trị, bao gồm REINFORCE, SARSA, DQN, Double DQN và Phát lại trải nghiệm ưu tiên (PER)
Đi sâu vào các thuật toán kết hợp, bao gồm Tối ưu hóa chính sách phê bình tác nhân và tối ưu hóa chính sách gần nhất (PPO)
Hiểu cách các thuật toán có thể được song song hóa đồng bộ và không đồng bộ
Chạy các thuật toán trong SLM Lab và tìm hiểu các chi tiết triển khai thực tế để RL sâu hoạt động
Khám phá kết quả điểm chuẩn thuật toán với các siêu tham số được điều chỉnh
Hiểu cách thiết kế môi trường RL sâu
Đăng ký sách của bạn để có quyền truy cập thuận tiện vào việc tải xuống, cập nhật và/hoặc chỉnh sửa khi chúng có sẵn. Xem sách bên trong để biết chi tiết.
Chapter 1: Introduction to Reinforcement Learning
Part I: Policy-Based and Value-Based Algorithms
Chapter 2: Policy Gradient
Chapter 3: State Action Reward State Action
Chapter 4: Deep Q-Networks
Chapter 5: Improving Deep Q-Networks
Part II: Combined Methods
Chapter 6: Advantage Actor-Critic
Chapter 7: Proximal Policy Optimization
Chapter 8: Parallelization Methods
Chapter 9: Algorithm Summary
Part III: Practical Tips
Chapter 10: Getting Reinforcement Learning to Work
Chapter 11: SLM Lab
Chapter 12: Network Architectures
Chapter 13: Hardward
Chapter 14: Environment Design
Epilogue
Appendix A: Deep Reinforcement Learning Timeline
Appendix B: Example Environments
References
Index
Giới thiệu đương đại về Học tập tăng cường sâu kết hợp lý thuyết và thực hành
Học tăng cường sâu (deep RL) kết hợp học sâu và học tăng cường, trong đó các tác nhân nhân tạo học cách giải quyết các vấn đề ra quyết định tuần tự. Trong thập kỷ qua, deep RL đã đạt được những kết quả đáng chú ý về nhiều vấn đề, từ các trò chơi đơn và nhiều người chơi – chẳng hạn như cờ vây, trò chơi Atari và DotA 2 – cho đến chế tạo robot.
Nền tảng của Học tăng cường sâu là phần giới thiệu về RL sâu kết hợp độc đáo cả lý thuyết và cách thực hiện. Nó bắt đầu bằng trực giác, sau đó giải thích cẩn thận lý thuyết về thuật toán RL sâu, thảo luận về việc triển khai trong thư viện phần mềm đồng hành SLM Lab và kết thúc bằng các chi tiết thực tế để giúp RL sâu hoạt động.
Hướng dẫn này lý tưởng cho cả sinh viên khoa học máy tính và kỹ sư phần mềm đã quen thuộc với các khái niệm học máy cơ bản và có hiểu biết làm việc về Python.
Hiểu từng khía cạnh chính của một vấn đề RL sâu sắc
Khám phá các thuật toán dựa trên chính sách và giá trị, bao gồm REINFORCE, SARSA, DQN, Double DQN và Phát lại trải nghiệm ưu tiên (PER)
Đi sâu vào các thuật toán kết hợp, bao gồm Tối ưu hóa chính sách phê bình tác nhân và tối ưu hóa chính sách gần nhất (PPO)
Hiểu cách các thuật toán có thể được song song hóa đồng bộ và không đồng bộ
Chạy các thuật toán trong SLM Lab và tìm hiểu các chi tiết triển khai thực tế để RL sâu hoạt động
Khám phá kết quả điểm chuẩn thuật toán với các siêu tham số được điều chỉnh
Hiểu cách thiết kế môi trường RL sâu
Đăng ký sách của bạn để có quyền truy cập thuận tiện vào việc tải xuống, cập nhật và/hoặc chỉnh sửa khi chúng có sẵn. Xem sách bên trong để biết chi tiết.
Chapter 1: Introduction to Reinforcement Learning
Part I: Policy-Based and Value-Based Algorithms
Chapter 2: Policy Gradient
Chapter 3: State Action Reward State Action
Chapter 4: Deep Q-Networks
Chapter 5: Improving Deep Q-Networks
Part II: Combined Methods
Chapter 6: Advantage Actor-Critic
Chapter 7: Proximal Policy Optimization
Chapter 8: Parallelization Methods
Chapter 9: Algorithm Summary
Part III: Practical Tips
Chapter 10: Getting Reinforcement Learning to Work
Chapter 11: SLM Lab
Chapter 12: Network Architectures
Chapter 13: Hardward
Chapter 14: Environment Design
Epilogue
Appendix A: Deep Reinforcement Learning Timeline
Appendix B: Example Environments
References
Index