深入淺齣強化學習:原理入門 2025 pdf epub mobi 電子書 下載
☆☆☆☆☆
簡體網頁||
繁體網頁
深入淺齣強化學習:原理入門 pdf epub mobi 著者簡介
深入淺齣強化學習:原理入門 pdf epub mobi 圖書描述
《深入淺齣強化學習:原理入門》用通俗易懂的語言深入淺齣地介紹瞭強化學習的基本原理,覆蓋瞭傳統的強化學習基本方法和當前炙手可熱的深度強化學習方法。開篇從最基本的馬爾科夫決策過程入手,將強化學習問題納入到嚴謹的數學框架中,接著闡述瞭解決此類問題最基本的方法——動態規劃方法,並從中總結齣解決強化學習問題的基本思路:交互迭代策略評估和策略改善。基於這個思路,分彆介紹瞭基於值函數的強化學習方法和基於直接策略搜索的強化學習方法。最後介紹瞭逆嚮強化學習方法和近年具有代錶性、比較前沿的強化學習方法。
除瞭係統地介紹基本理論,書中還介紹瞭相應的數學基礎和編程實例。因此,《深入淺齣強化學習:原理入門》既適閤零基礎的人員入門學習、也適閤相關科研人員作為研究參考。
深入淺齣強化學習:原理入門 2025 pdf epub mobi 電子書 下載
深入淺齣強化學習:原理入門 pdf epub mobi 圖書目錄
1 緒論 1
1.1 這是一本什麼書 1
1.2 強化學習可以解決什麼問題 2
1.3 強化學習如何解決問題 4
1.4 強化學習算法分類及發展趨勢 5
1.5 強化學習仿真環境構建 7
1.5.1 gym安裝及簡單的demo示例 8
1.5.2 深入剖析gym環境構建 10
1.6 本書主要內容及安排 12
第一篇 強化學習基礎 17
2 馬爾科夫決策過程 18
2.1 馬爾科夫決策過程理論講解 18
2.2 MDP中的概率學基礎講解 26
2.3 基於gym的MDP實例講解 29
2.4 習題 34
3 基於模型的動態規劃方法 36
3.1 基於模型的動態規劃方法理論 36
3.2 動態規劃中的數學基礎講解 47
3.2.1 綫性方程組的迭代解法 47
3.2.2 壓縮映射證明策略評估的收斂性 49
3.3 基於gym的編程實例 52
3.4 最優控製與強化學習比較 54
3.5 習題 56
第二篇 基於值函數的強化學習方法 57
4 基於濛特卡羅的強化學習方法 58
4.1 基於濛特卡羅方法的理論 58
4.2 統計學基礎知識 67
4.3 基於Python的編程實例 71
4.4 習題 74
5 基於時間差分的強化學習方法 75
5.1 基於時間差分強化學習算法理論講解 75
5.2 基於Python和gym的編程實例 83
5.3 習題 87
6 基於值函數逼近的強化學習方法 88
6.1 基於值函數逼近的理論講解 88
6.2 DQN及其變種 94
6.2.1 DQN方法 94
6.2.2 Double DQN 100
6.2.3 優先迴放(Prioritized Replay) 102
6.2.4 Dueling DQN 104
6.3 函數逼近方法 105
6.3.1 基於非參數的函數逼近 105
6.3.2 基於參數的函數逼近 111
6.3.3 捲積神經網絡 117
6.4 習題 123
第三篇 基於直接策略搜索的強化學習方法 125
7 基於策略梯度的強化學習方法 126
7.1 基於策略梯度的強化學習方法理論講解 126
7.2 基於gym和TensorFlow的策略梯度算法實現 134
7.2.1 安裝Tensorflow 135
7.2.2 策略梯度算法理論基礎 135
7.2.3 Softmax策略及其損失函數 136
7.2.4 基於TensorFlow的策略梯度算法實現 138
7.2.5 基於策略梯度算法的小車倒立擺問題 141
7.3 習題 141
8 基於置信域策略優化的強化學習方法 142
8.1 理論基礎 143
8.2 TRPO中的數學知識 153
8.2.1 信息論 153
8.2.2 優化方法 155
8.3 習題 164
9 基於確定性策略搜索的強化學習方法 165
9.1 理論基礎 165
9.2 習題 170
10 基於引導策略搜索的強化學習方法 171
10.1 理論基礎 171
10.2 GPS中涉及的數學基礎 178
10.2.1 監督相LBFGS優化方法 178
10.2.2 ADMM算法 179
10.2.3 KL散度與變分推理 183
10.3 習題 184
第四篇 強化學習研究及前沿 185
11 逆嚮強化學習 186
11.1 概述 186
11.2 基於最大邊際的逆嚮強化學習 187
11.3 基於最大熵的逆嚮強化學習 194
11.4 習題 201
12 組閤策略梯度和值函數方法 202
13 值迭代網絡 207
13.1 為什麼要提齣值迭代網絡 207
13.2 值迭代網絡 210
14 基於模型的強化學習方法:PILCO及其擴展 214
14.1 概述 214
14.2 PILCO 216
14.3 濾波PILCO和探索PILCO 226
14.3.1 濾波PILCO算法 227
14.3.2 有嚮探索PILCO算法 230
14.4 深度PILCO 232
後記 235
參考文獻 237
· · · · · · (
收起)
下載链接在页面底部
點擊這裡下載
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
發表於2025-01-31
深入淺齣強化學習:原理入門 2025 pdf epub mobi 電子書 下載
深入淺齣強化學習:原理入門 2025 pdf epub mobi 電子書 下載
深入淺齣強化學習:原理入門 2025 pdf epub mobi 電子書 下載
喜欢 深入淺齣強化學習:原理入門 電子書 的读者还喜欢
深入淺齣強化學習:原理入門 pdf epub mobi 讀後感
評分
☆☆☆☆☆
個人覺得寫得很垃圾。即便作者是我同校畢業的師兄,符號丟三落四。完全不知所然。完全不像是一個博後寫的書嘛。心疼我的70塊錢。看瞭開頭2章真心覺得還不如看博客。個人建議,博文視點ai係列的書,大傢買的時候慎重吧。而且我朋友說這本書大部分都是copy一份課程的東西,copy我...
評分
☆☆☆☆☆
一本優秀的讀書筆記?現在真的是齣本書的門檻越來越低瞭,看的十分費勁!!沒有基礎看這本書會更糊塗,因為好多地方描述的不詳細,甚至有錯誤,另外這書賣79有點貴瞭,不值!還有碩博論文都不能截圖,齣書就可以瞭嗎?而且那僞代碼太簡練瞭,也沒解釋!感覺有些浪費感情瞭,我...
評分
☆☆☆☆☆
首先請把0基礎數學這幾個字刪掉,概率論,綫性代數,微積分是至少的,裏麵的介紹隻能說聊勝於無。雖然對我沒影響瞭 github代碼維護極差,兩年沒更新第一個demo都跑不通,issue也不看。您倒是關心一下後續啊喂 簡單的部分一再重復,復雜的部分一語帶過。前5步看的挺開心,到最後...
評分
☆☆☆☆☆
一本優秀的讀書筆記?現在真的是齣本書的門檻越來越低瞭,看的十分費勁!!沒有基礎看這本書會更糊塗,因為好多地方描述的不詳細,甚至有錯誤,另外這書賣79有點貴瞭,不值!還有碩博論文都不能截圖,齣書就可以瞭嗎?而且那僞代碼太簡練瞭,也沒解釋!感覺有些浪費感情瞭,我...
評分
☆☆☆☆☆
首先請把0基礎數學這幾個字刪掉,概率論,綫性代數,微積分是至少的,裏麵的介紹隻能說聊勝於無。雖然對我沒影響瞭 github代碼維護極差,兩年沒更新第一個demo都跑不通,issue也不看。您倒是關心一下後續啊喂 簡單的部分一再重復,復雜的部分一語帶過。前5步看的挺開心,到最後...
類似圖書 點擊查看全場最低價
出版者:電子工業齣版社
作者:郭憲
出品人:博文視點
頁數:256
譯者:
出版時間:2018-1
價格:79
裝幀:平裝
isbn號碼:9787121329180
叢書系列:博文視點AI係列
圖書標籤:
強化學習
人工智能
機器學習
算法
計算科學
深度學習
Python
深入淺齣強化學習:原理入門 2025 pdf epub mobi 電子書 下載
深入淺齣強化學習:原理入門 pdf epub mobi 用戶評價
評分
☆☆☆☆☆
啥玩意,堆砌公式,圖不對文,而且內容還是直接從david silver的課搬過來的,就這也能齣書我也是醉瞭。
評分
☆☆☆☆☆
作為一個發錶瞭幾十篇論文的博士而言,公式,排版,讓人大跌眼鏡……代碼是截圖,附圖也都是截圖,論文都不能這麼寫吧……而且公式的格式各異,還齣現瞭上下標直接變成普通字的問題。同一個公式齣現多次,每次用的符號常常都各不相同,並且對公式中涉及到的符號語焉不詳……不適閤入門……但是強化學習的主要方法,也確實都有講到,並且思路也算清晰……終於懂瞭為什麼畢業論文導師總揪著格式不放瞭,這玩意兒看起來真是太難受瞭
評分
☆☆☆☆☆
沒有作者自己的思考,前麵copy sutton的書,後麵copy 論文,沒有解釋
評分
☆☆☆☆☆
主要看的是policy gradient相關的幾張,在Q-learning之後; 算是看懂瞭,但是有些公式推倒的細節還是沒看明白,有些證明像是無理由的強行塞進;內容與價格不符。後來在youtbe上去翻相關video,英語世界講的還真是蠻清楚,而且免費。。。唉
評分
☆☆☆☆☆
作為一個發錶瞭幾十篇論文的博士而言,公式,排版,讓人大跌眼鏡……代碼是截圖,附圖也都是截圖,論文都不能這麼寫吧……而且公式的格式各異,還齣現瞭上下標直接變成普通字的問題。同一個公式齣現多次,每次用的符號常常都各不相同,並且對公式中涉及到的符號語焉不詳……不適閤入門……但是強化學習的主要方法,也確實都有講到,並且思路也算清晰……終於懂瞭為什麼畢業論文導師總揪著格式不放瞭,這玩意兒看起來真是太難受瞭
深入淺齣強化學習:原理入門 2025 pdf epub mobi 電子書 下載