作者簡介
Richard Sutton(理查德•薩頓)
埃德濛頓 DeepMind 公司的傑齣科學傢,阿爾伯塔大學計算科學係教授。他於2003年加入阿爾伯塔大學,2017年加入DeepMind。之前,曾在美國電話電報公司(AT&T)和通用電話電子公司(GTE)實驗室工作,在馬薩諸塞大學做學術研究。
1978年獲得斯坦福大學心理學學士學位,1984年獲得馬薩諸塞大學計算機科學博士學位,加拿大皇傢學會院士和人工智能促進會的會士。
主要研究興趣是在決策者與環境相互作用時所麵臨的學習問題,他認為這是智能的核心問題。其他研究興趣有:動物學習心理學、聯結主義網絡,以及能夠不斷學習和改進環境錶徵和環境模型的係統。
他的科學齣版物被引用超過7萬次。
他也是一名自由主義者,國際象棋選手和癌癥幸存者。
Andrew Barto (安德魯•巴圖)
馬薩諸塞大學阿默斯特分校信息與計算機科學學院名譽教授。1970年獲得密歇根大學數學專業的傑齣學士學位,並於1975年獲該校計算機科學專業的博士學位。1977年他加入馬薩諸塞州阿默斯特大學計算機科學係。在2012年退休之前,他帶領瞭馬薩諸塞大學的自主學習實驗室,該實驗室培養瞭許多著名的機器學習研究者。
目前擔任Neural Computation (《神經計算》)期刊的副主編,Journal of Machine Learning Research (《機器學習研究》)期刊的顧問委員會成員,以及Adaptive Behavior (《自適應行為》)期刊的編委員會成員。
他是美國科學促進會的會員,IEEE(國際電子電氣工程師協會)的終身會士(Life Fellow),也是神經科學學會的成員。
2004年,因強化學習領域的貢獻榮獲IEEE神經網絡學會先鋒奬,並因在強化學習理論和應用方麵的開創、富有影響力的研究獲得 IJCAI-17卓越研究奬;2019年獲得馬薩諸塞大學神經科學終身成就奬。
他在各類期刊、會議和研討會上發錶瞭100多篇論文,參與撰寫多部圖書的相關章節。
譯者簡介
俞凱
上海交通大學計算科學與工程係教授,思必馳公司創始人、首席科學傢。清華大學自動化係本科、碩士,劍橋大學工程係博士。青年韆人,國傢自然科學基金委優青,上海市“東方學者”特聘教授。IEEE 高級會員,現任 IEEE Speech and Language Processing Technical Committee 委員,中國人工智能産業發展聯盟學術和知識産權組組長,中國計算機學會語音對話及聽覺專業組副主任。
長期從事交互式人工智能,尤其是智能語音及自然語言處理的研究和産業化工作。發錶國際期刊和會議論文 150 餘篇,獲得Computer Speech and Language, Speech Communication 等多個國際期刊及InterSpeech等國際會議的最優論文奬,所搭建的工程係統曾獲美國國傢標準局語音識彆評測冠軍,對話係統國際研究挑戰賽冠軍等。
獲評2014“吳文俊人工智能科學技術奬”進步奬,“2016科學中國人年度人物”,2018中國計算機學會“青竹奬”。
《強化學習(第2版)》作為強化學習思想的深度解剖之作,被業內公認為是一本強化學習基礎理論的經典著作。它從強化學習的基本思想齣發,深入淺齣又嚴謹細緻地介紹瞭馬爾可夫決策過程、濛特卡洛方法、時序差分方法、同軌離軌策略等強化學習的基本概念和方法,並以大量的實例幫助讀者理解強化學習的問題建模過程以及核心的算法細節。
《強化學習(第2版)》適閤所有對強化學習感興趣的讀者閱讀、收藏。
發表於2024-12-23
強化學習(第2版) 2024 pdf epub mobi 電子書 下載
這是一本極好的書,不僅能使你對強化學習有精確、透徹的理解,更能夠提升你的思維層次。 接觸人工智能領域6年多瞭,用過統計學習和深度學習做過一些項目。目前,David Silver的教學視頻已經過完,這本書讀到瞭第10章(第二版)。下麵說一下個人淺陋的理解。 目前應用最廣泛的監...
評分[http://incompleteideas.net/book/the-book-2nd.html] 有 [第二版的 PDF(][http://incompleteideas.net/book/bookdraft2018jan1.pdf)][ ],還有 [Python 實現]([https://github.com/ShangtongZhang/reinforcement-learning-an-introduction])。
評分[http://incompleteideas.net/book/the-book-2nd.html] 有 [第二版的 PDF(][http://incompleteideas.net/book/bookdraft2018jan1.pdf)][ ],還有 [Python 實現]([https://github.com/ShangtongZhang/reinforcement-learning-an-introduction])。
評分可以在綫閱讀,還不錯的 我還沒仔細讀,先把網址公布齣來,大傢一起學習 http://webdocs.cs.ualberta.ca/~sutton/book/ebook/the-book.html
評分[http://incompleteideas.net/book/the-book-2nd.html] 有 [第二版的 PDF(][http://incompleteideas.net/book/bookdraft2018jan1.pdf)][ ],還有 [Python 實現]([https://github.com/ShangtongZhang/reinforcement-learning-an-introduction])。
圖書標籤: 強化學習 機器學習 人工智能 計算機科學 reinforcement 計算機 RL 大數據
除瞭幾個專用名詞翻譯的不太好並且沒給齣英文對照,整篇翻譯挺贊的
評分宅傢不便,買瞭這本“譯著”。又是一本老師拿項目組裏同學一人一章榖歌翻譯的大作。生硬翻譯以至含義扭麯,大量字符、編號錯誤,甚至還有LaTeX未編譯完成齣現的“??”。勸各位不要讀這個譯本,盡量讀原版吧。
評分力薦,這種書還是中英對照著看好,強化學習本來就難懂,硬上英文版更是難上加難。最好配閤GitHub上代碼來一起研究
評分中文翻譯還可以 但原版也得過一遍 看完以後刷paper去
評分宅傢不便,買瞭這本“譯著”。又是一本老師拿項目組裏同學一人一章榖歌翻譯的大作。生硬翻譯以至含義扭麯,大量字符、編號錯誤,甚至還有LaTeX未編譯完成齣現的“??”。勸各位不要讀這個譯本,盡量讀原版吧。
強化學習(第2版) 2024 pdf epub mobi 電子書 下載