【作者介紹】
Drew Conway 機器學習專傢,擁有豐富的數據分析與處理工作經驗。目前主要利用數學、統計學和計算機技術研究國際關係、衝突和恐怖主義等。他曾作為研究員在美國情報和國防部門供職數年。他擁有紐約大學政治係博士學位,曾為多種雜誌撰寫文章,是機器學習領域的著名學者。
John Myles White 機器學習專傢,擁有豐富的數據分析與處理工作經驗。目前主要從理論和實驗的角度來研究人類如何做齣決定,同時還是幾個流行的R語言程序包的主要維護者,包括ProjectTemplate和log4r。他擁有普林斯頓大學哲學係博士學位,曾為多傢技術雜誌撰稿,發錶過許多關於機器學習的論文,並在眾多國際會議上發錶演講。
【譯者介紹】
羅森林 博士,教授,博導。現任北京理工大學信息係統及安全對抗實驗中心主任、專業責任教授。國防科技工業局科學技術委員會成員;《中國醫學影像技術雜誌》、《中國介入影像與治療學》編委會委員;全國大學生信息安全技術專題邀請賽專傢組副組長;中國人工智能學會智能信息安全專業委員會委員等。主要研究方嚮為信息安全、數據挖掘、媒體計算、中文信息處理等。負責或參加完成國傢自然科學基金、國傢科技支撐計劃、863計劃、國傢242計劃等省部級以上項目40餘項。已發錶學術論文90餘篇,齣版著作8部,齣版譯著1部,獲授權專利3項。
陳開江 新浪微博搜索部研發工程師,曾獨立負責微博內容反垃圾係統、微博精選內容挖掘算法、自助客服係統(包括自動迴復、主動挖掘、輿情監測)等項目,目前主要從事社交挖掘、推薦算法研究、機器學習、自然語言處理相關工作,研究興趣是社交網絡的個性化推薦。
劉逸哲 阿裏巴巴,CBU基礎平颱部搜索與推薦團隊核心技術與query分析方嚮負責人,機器學習技術領域及圈子負責人。曾任中國雅虎相關性團隊、自然語言處理團隊算法工程師;AvePoint.inc開發工程師,從事企業級搜索引擎開發。研究興趣是機器學習、自然語言處理及個性化推薦等算法在大規模數據上的應用。
孟曉楠 一淘廣告技術,阿裏非搜索廣告算法負責人,負責用戶行為分析、建模與細分,RTB競價算法,展示廣告CTR預估與SEM優化。曾工作於網易杭州研究院,參與過分布式全文檢索係統和網易博客産品的數據挖掘算法開發。研究興趣是計算廣告技術、機器學習、大數據技術、信息檢索等。
這本書為機器學習技術提供瞭一些非常棒的案例研究。它並不想成為一本關於機器學習的工具書或者理論書籍,它注重的是一個學習的過程,因而對於任何有一些編程背景和定量思維的人來說,它都是不錯的選擇。
——Max Shron OkCupid
機器學習是計算機科學和人工智能中非常重要的一個研究領域,近年來,機器學習不但在計算機科學的眾多領域中大顯身手,而且成為一些交叉學科的重要支撐技術。本書比較全麵係統地介紹瞭機器學習的方法和技術,不僅詳細闡述瞭許多經典的學習方法,還討論瞭一些有生命力的新理論、新方法。
全書案例既有分類問題,也有迴歸問題;既包含監督學習,也涵蓋無監督學習。本書討論的案例從分類講到迴歸,然後討論瞭聚類、降維、最優化問題等。這些案例包括分類:垃圾郵件識彆,排序:智能收件箱,迴歸模型:預測網頁訪問量,正則化:文本迴歸,最優化:密碼破解,無監督學習:構建股票市場指數,空間相似度:用投票記錄對美國參議員聚類,推薦係統:給用戶推薦R語言包,社交網絡分析:在Twitter上感興趣的人,模型比較:給你的問題找到最佳算法。各章對原理的敘述力求概念清晰、錶達準確,突齣理論聯係實際,富有啓發性,易於理解。在探索這些案例的過程中用到的基本工具就是R統計編程語言。R語言非常適閤用於機器學習的案例研究,因為它是一種用於數據分析的高水平、功能性腳本語言。
本書主要內容:
·開發一個樸素貝葉斯分類器,僅僅根據郵件的文本信息來判斷這封郵件是否是垃圾郵件;
·使用綫性迴歸來預測互聯網排名前1000網站的PV;
·利用文本迴歸理解圖書中詞與詞之間的關係;
·通過嘗試破譯一個簡單的密碼來學習優化技術;
·利用無監督學習構建股票市場指數,用於衡量整體市場行情的好壞;
·根據美國參議院的投票情況,從統計學的角度對美國參議員聚類;
·通過K近鄰算法構建嚮用戶推薦R語言包;
·利用Twitter數據來構建一個“你可能感興趣的人”的推薦係統;
·模型比較:給你的問題找到最佳算法。
發表於2024-11-21
機器學習 2024 pdf epub mobi 電子書 下載
剛讀完書,google瞭一下書評,看到有人抱怨說這本書根本不是為hacker準備的,因為會詳細介紹非常基礎的編程,比如講垃圾郵件classification那一章裏花瞭大篇幅講string parsing。 看完的感覺是這本書的確不是麵嚮programmer的,但書名其實也沒錯。它是一本Machine Learning 的...
評分非常簡單的英語,非常簡單的數學基礎,沒有數學公式,有大量的R代碼,有非常淺顯的機器學習的應用實例,例如垃圾郵件識彆,郵件重要性排序,pv預估等等;有一些簡單的模型的介紹,例如logistic regression,綫性迴歸,多項式迴歸等等;有一些基礎的機器學習概念的介紹,例如交...
評分書讀瞭近半本,迴來書評。 這本書內容我認為很好,排版也很不錯。排版不多說,在同時接觸與處理數學公式、代碼與僞代碼、眾多圖錶時難免會有一些頭大,但這本書我認為是我見過很多書中排版最容易接受的一種; 內容上,當初買時的初心不少,想入門機器學習,掌握python的代碼實...
評分很基礎的一本書,看得齣作者是一個實踐之上的人,凡涉及到復雜的理論推導,一律略去,告訴讀者,可以去哪裏找到詳細的數學推導。然後具體介紹如何應用這些算法模型來解決具體的實際問題。涉及到瞭垃圾郵件識彆(分類),郵件排序(分類),pv預估(迴歸),密碼破譯(優化),...
評分剛讀完書,google瞭一下書評,看到有人抱怨說這本書根本不是為hacker準備的,因為會詳細介紹非常基礎的編程,比如講垃圾郵件classification那一章裏花瞭大篇幅講string parsing。 看完的感覺是這本書的確不是麵嚮programmer的,但書名其實也沒錯。它是一本Machine Learning 的...
圖書標籤: 機器學習 R 數據挖掘 計算機 數據分析 機器學習:實用案例解析 統計 R語言
與集體智慧編程是一類的書
評分實踐齣真知>>數據分析齣真知。
評分很好!
評分標題說是機器學習-實用案例解析,而實際上原標題是Machine Learning for Hacker。內容基本是實踐,點到為止,不深入,較泛。另外翻譯質量也不太滿意
評分寫給統計學傢的機器學習書,寫給MLer的統計分析書,寫給R語言初學者的實踐進階書,寫給開發工程師的算法入門書。這本書把所有的公式都忽略掉瞭,比大名鼎鼎的集體智慧編程還要誇張和簡單....
機器學習 2024 pdf epub mobi 電子書 下載