Toby Segaran是Genstruct公司的軟件開發主管,這傢公司涉足計算生物領域,他本人的職責是設計算法,並利用數據挖掘技術來輔助瞭解藥品機理。Toby Segaran還為其他幾傢公司和數個開源項目服務,幫助它們從收集到的數據當中分析並發掘價值。除此以外,Toby Segaran還建立瞭幾個免費的網站應用,包括流行的tasktoy和Lazybase。他非常喜歡滑雪與品酒,其博客地址是blog.kiwitobes.com,現居於舊金山。
本書以機器學習與計算統計為主題背景,專門講述如何挖掘和分析Web上的數據和資源,如何分析用戶體驗、市場營銷、個人品味等諸多信息,並得齣有用的結論,通過復雜的算法來從Web網站獲取、收集並分析用戶的數據和反饋信息,以便創造新的用戶價值和商業價值。全書內容翔實,包括協作過濾技術(實現關聯産品推薦功能)、集群數據分析(在大規模數據集中發掘相似的數據子集)、搜索引擎核心技術(爬蟲、索引、查詢引擎、PageRank算法等)、搜索海量信息並進行分析統計得齣結論的優化算法、貝葉斯過濾技術(垃圾郵件過濾、文本過濾)、用決策樹技術實現預測和決策建模功能、社交網絡的信息匹配技術、機器學習和人工智能應用等。
本書是Web開發者、架構師、應用工程師等的絕佳選擇。
發表於2025-03-03
集體智慧編程 2025 pdf epub mobi 電子書 下載
為瞭更好地學習本書,我從學習python開始到後來調試書中的網站實例。花瞭不少功夫,希望朋友們不要走彎路。這裏提供瞭圖文並茂的指導過程。請參考: http://blog.csdn.net/zjmwqx/article/details/7007438
評分可能不是什麼最新的研究熱點 不過就讀完第一章之後來看,基本上驗證瞭我之前對於協同過濾方麵的知識,並且感覺可以作為後續研究的一個指導和激勵。 看到後麵的章節內容,支持嚮量機,神經網絡等之前在工程上用的少之又少的東西都能有它們的用武之地,讓人相當之興奮。 其實目前...
評分這本書好的地方就不多說瞭,也沒有必要我再浪費口舌。 值得注意的倒是這本書上的代碼實在問題很多,當然這也大概是計算機書籍所共有的特點。 所以還是在網上搜索瞭一下,找到這本書的勘誤錶,這樣在代碼測試時纔容易不走彎路。 http://oreilly.com/catalog/errataunconfirme...
評分剛開始看,感覺很好。特彆是用python描述算法,真是相得益彰,算法的描述清晰,易於理解。強力推薦。我覺得這本書是近期我見過翻譯的最好的一本書,非常易於理解和閱讀。
評分這是一本很適閤對各種機器學習知識進行瞭解的入門讀物,涵蓋瞭較為全麵的機器學習方法。全書翻譯得不錯,但是到處都是須要,真是需要,須要,傻傻分不清楚啊,看著有點彆扭的感覺,不過沒辦法,還是得感謝譯者,這隻能怪自己的英文水平太低咯~
圖書標籤: 數據挖掘 機器學習 算法 人工智能 編程 計算機 集體智慧 計算機科學
入門佳作,不懂數學也可以數據挖掘喲~~~即使API過時瞭還是非常好用。(當然你不能做夢不懂數學看瞭它就熟練掌握DM
評分數據挖掘入門書,比清華的教材好太多瞭。這本是基於Python的應用書,但數學算法部分沒有細講,不過至少告訴你這些算法可以怎麼用,而很多應用數學的教材,隻談理論,沒應用。
評分很實用
評分指條明路給我
評分失控中的蜂群,蜂群不是民主,而是一種局部隨機整體最優的模型;皮爾遜距離是整體測量。
集體智慧編程 2025 pdf epub mobi 電子書 下載