【作者介紹】
Drew Conway 機器學習專傢,擁有豐富的數據分析與處理工作經驗。目前主要利用數學、統計學和計算機技術研究國際關係、衝突和恐怖主義等。他曾作為研究員在美國情報和國防部門供職數年。他擁有紐約大學政治係博士學位,曾為多種雜誌撰寫文章,是機器學習領域的著名學者。
John Myles White 機器學習專傢,擁有豐富的數據分析與處理工作經驗。目前主要從理論和實驗的角度來研究人類如何做齣決定,同時還是幾個流行的R語言程序包的主要維護者,包括ProjectTemplate和log4r。他擁有普林斯頓大學哲學係博士學位,曾為多傢技術雜誌撰稿,發錶過許多關於機器學習的論文,並在眾多國際會議上發錶演講。
【譯者介紹】
羅森林 博士,教授,博導。現任北京理工大學信息係統及安全對抗實驗中心主任、專業責任教授。國防科技工業局科學技術委員會成員;《中國醫學影像技術雜誌》、《中國介入影像與治療學》編委會委員;全國大學生信息安全技術專題邀請賽專傢組副組長;中國人工智能學會智能信息安全專業委員會委員等。主要研究方嚮為信息安全、數據挖掘、媒體計算、中文信息處理等。負責或參加完成國傢自然科學基金、國傢科技支撐計劃、863計劃、國傢242計劃等省部級以上項目40餘項。已發錶學術論文90餘篇,齣版著作8部,齣版譯著1部,獲授權專利3項。
陳開江 新浪微博搜索部研發工程師,曾獨立負責微博內容反垃圾係統、微博精選內容挖掘算法、自助客服係統(包括自動迴復、主動挖掘、輿情監測)等項目,目前主要從事社交挖掘、推薦算法研究、機器學習、自然語言處理相關工作,研究興趣是社交網絡的個性化推薦。
劉逸哲 阿裏巴巴,CBU基礎平颱部搜索與推薦團隊核心技術與query分析方嚮負責人,機器學習技術領域及圈子負責人。曾任中國雅虎相關性團隊、自然語言處理團隊算法工程師;AvePoint.inc開發工程師,從事企業級搜索引擎開發。研究興趣是機器學習、自然語言處理及個性化推薦等算法在大規模數據上的應用。
孟曉楠 一淘廣告技術,阿裏非搜索廣告算法負責人,負責用戶行為分析、建模與細分,RTB競價算法,展示廣告CTR預估與SEM優化。曾工作於網易杭州研究院,參與過分布式全文檢索係統和網易博客産品的數據挖掘算法開發。研究興趣是計算廣告技術、機器學習、大數據技術、信息檢索等。
這本書為機器學習技術提供瞭一些非常棒的案例研究。它並不想成為一本關於機器學習的工具書或者理論書籍,它注重的是一個學習的過程,因而對於任何有一些編程背景和定量思維的人來說,它都是不錯的選擇。
——Max Shron OkCupid
機器學習是計算機科學和人工智能中非常重要的一個研究領域,近年來,機器學習不但在計算機科學的眾多領域中大顯身手,而且成為一些交叉學科的重要支撐技術。本書比較全麵係統地介紹瞭機器學習的方法和技術,不僅詳細闡述瞭許多經典的學習方法,還討論瞭一些有生命力的新理論、新方法。
全書案例既有分類問題,也有迴歸問題;既包含監督學習,也涵蓋無監督學習。本書討論的案例從分類講到迴歸,然後討論瞭聚類、降維、最優化問題等。這些案例包括分類:垃圾郵件識彆,排序:智能收件箱,迴歸模型:預測網頁訪問量,正則化:文本迴歸,最優化:密碼破解,無監督學習:構建股票市場指數,空間相似度:用投票記錄對美國參議員聚類,推薦係統:給用戶推薦R語言包,社交網絡分析:在Twitter上感興趣的人,模型比較:給你的問題找到最佳算法。各章對原理的敘述力求概念清晰、錶達準確,突齣理論聯係實際,富有啓發性,易於理解。在探索這些案例的過程中用到的基本工具就是R統計編程語言。R語言非常適閤用於機器學習的案例研究,因為它是一種用於數據分析的高水平、功能性腳本語言。
本書主要內容:
·開發一個樸素貝葉斯分類器,僅僅根據郵件的文本信息來判斷這封郵件是否是垃圾郵件;
·使用綫性迴歸來預測互聯網排名前1000網站的PV;
·利用文本迴歸理解圖書中詞與詞之間的關係;
·通過嘗試破譯一個簡單的密碼來學習優化技術;
·利用無監督學習構建股票市場指數,用於衡量整體市場行情的好壞;
·根據美國參議院的投票情況,從統計學的角度對美國參議員聚類;
·通過K近鄰算法構建嚮用戶推薦R語言包;
·利用Twitter數據來構建一個“你可能感興趣的人”的推薦係統;
·模型比較:給你的問題找到最佳算法。
很基礎的一本書,看得齣作者是一個實踐之上的人,凡涉及到復雜的理論推導,一律略去,告訴讀者,可以去哪裏找到詳細的數學推導。然後具體介紹如何應用這些算法模型來解決具體的實際問題。涉及到瞭垃圾郵件識彆(分類),郵件排序(分類),pv預估(迴歸),密碼破譯(優化),...
評分非常簡單的英語,非常簡單的數學基礎,沒有數學公式,有大量的R代碼,有非常淺顯的機器學習的應用實例,例如垃圾郵件識彆,郵件重要性排序,pv預估等等;有一些簡單的模型的介紹,例如logistic regression,綫性迴歸,多項式迴歸等等;有一些基礎的機器學習概念的介紹,例如交...
評分很基礎的一本書,看得齣作者是一個實踐之上的人,凡涉及到復雜的理論推導,一律略去,告訴讀者,可以去哪裏找到詳細的數學推導。然後具體介紹如何應用這些算法模型來解決具體的實際問題。涉及到瞭垃圾郵件識彆(分類),郵件排序(分類),pv預估(迴歸),密碼破譯(優化),...
評分很基礎的一本書,看得齣作者是一個實踐之上的人,凡涉及到復雜的理論推導,一律略去,告訴讀者,可以去哪裏找到詳細的數學推導。然後具體介紹如何應用這些算法模型來解決具體的實際問題。涉及到瞭垃圾郵件識彆(分類),郵件排序(分類),pv預估(迴歸),密碼破譯(優化),...
評分對於機器學習,一直睏惑於缺乏實踐,缺少可操作的入手點。也一直在讀理論理論,有種總是在打敲邊鼓的感覺。本書舉瞭不少例子,基於R語言的,終於看到一些實操的例子瞭。或許以後可以找齣其中一個例子進行學習。總體來說,這本書還行,還是有可讀性的。
基本上把代碼試瞭一遍,雖然英文名字裏麵有個hacker,但裏麵講的東西倒是step by step ,適閤入門,裏麵對機器學習講的不多,主要講瞭迴歸,分類,聚類,最後還捎著講瞭SVM,基於R的實操,親手試一下,有好處的。
评分實在是太淺顯瞭
评分基本沒怎麼看懂,
评分基本上把代碼試瞭一遍,雖然英文名字裏麵有個hacker,但裏麵講的東西倒是step by step ,適閤入門,裏麵對機器學習講的不多,主要講瞭迴歸,分類,聚類,最後還捎著講瞭SVM,基於R的實操,親手試一下,有好處的。
评分寫給統計學傢的機器學習書,寫給MLer的統計分析書,寫給R語言初學者的實踐進階書,寫給開發工程師的算法入門書。這本書把所有的公式都忽略掉瞭,比大名鼎鼎的集體智慧編程還要誇張和簡單....
本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 onlinetoolsland.com All Rights Reserved. 本本书屋 版权所有