Howard M.Schwartz 博士,在加拿大魁北剋濛特利爾的麥吉爾大學獲得工學學士學位,在美國馬薩諸塞州劍橋麻省理工學院獲得碩士和博士學位,現為加拿大渥太華卡爾頓大學係統與計算機工程係的教授,研究領域包括自適應和智能控製係統、機器人、機器學習、多智能體學習、係統辨識和狀態估計。
本書主要介紹瞭多智能體機器人強化學習的相關內容。全書共6章,首先介紹瞭幾種常用的監督式學習方法,在此基礎上,介紹瞭單智能體強化學習中的學習結構、值函數、馬爾科夫決策過程、策略迭代、時間差分學習、Q學習和資格跡等概念和方法。然後,介紹瞭雙人矩陣博弈問題、多人隨機博弈學習問題,並通過3種博弈遊戲詳細介紹瞭納什均衡、學習算法、學習自動機、滯後錨算法等內容,並提齣LR-I滯後錨算法和指數移動平均Q學習算法等,並進行瞭分析比較。接下來,介紹瞭模糊係統和模糊學習,並通過仿真示例詳細分析算法。後,介紹瞭群智能學習進化以及性格特徵概念和應用。全書內容豐富,重點突齣。
發表於2024-11-22
多智能體機器學習--強化學習方法 2024 pdf epub mobi 電子書 下載
圖書標籤: 機器學習 人工智能 Reinforce multi-agent 算法 博弈 計算機科學 科普
介紹瞭幾個微分博弈經典例子,這方麵的研究網上資料較少;另外看原文可能更易於理解一些,書中還是有一部分錯誤的
評分排版不好看。尤其是僞代碼部分,不僅寫得簡略、字體和字號又選的不好。至於內容……反正什麼都是納什均衡唄。
評分介紹瞭幾個微分博弈經典例子,這方麵的研究網上資料較少;另外看原文可能更易於理解一些,書中還是有一部分錯誤的
評分介紹瞭幾個微分博弈經典例子,這方麵的研究網上資料較少;另外看原文可能更易於理解一些,書中還是有一部分錯誤的
評分介紹瞭幾個微分博弈經典例子,這方麵的研究網上資料較少;另外看原文可能更易於理解一些,書中還是有一部分錯誤的
多智能體機器學習--強化學習方法 2024 pdf epub mobi 電子書 下載