Ron Zacharski是一名軟件開發工程師,曾在威斯康辛大學獲美術學士學位,之後還在明尼蘇達大學獲得瞭計算機科學博士學位。博士後期間,他在愛丁堡大學研究語言學。正是基於廣博的學識,他不僅在新墨西哥州立大學的計算研究實驗室工作,期間還接觸過自然語言處理相關的項目,而該實驗室曾被《連綫》雜誌評為機器翻譯研究領域翹楚。除此之外,他還曾教授計算機科學、語言學、音樂等課程,是一名博學多纔的科技達人。
王斌 博士,中國科學院信息工程研究所研究員,博士生導師,中國科學院大學兼職教授,研究方嚮為信息檢索、自然語言處理與數據挖掘。主持國傢973、863、國傢自然科學基金、國際閤作基金、部委及企業閤作等課題近30項,發錶學術論文130餘篇,領導研製的多個係統上綫使用,曾獲國傢科技進步二等奬和北京市科學技術二等奬各一項。現為中國中文信息學會理事、信息檢索、社會媒體處理、語言與知識計算等多個專業委員會委員、《中文信息學報》編委、中國計算機學會高級會員及中文信息處理專業委員會委員。多次擔任SIGIR、ACL、CIKM等會議的程序委員會委員。《信息檢索導論》、《大數據:互聯網大規模數據挖掘與分布式處理》、《機器學習實戰》、《Mahout實戰》譯者。2006年起在中國科學院大學講授《現代信息檢索》研究生課程,纍計選課人數已超過1500人。迄今培養博士、碩士研究生近40名。
數據挖掘一般是指從大量的數據中通過算法搜索隱藏於其中信息的過程。大多數數據挖掘的教材都專注於介紹理論基礎,因而往往難以理解和學習。
本書是寫給程序員的一本數據挖掘指南,可以幫助讀者動手實踐數據挖掘、集體智慧並構建推薦係統。全書共8章,介紹瞭數據挖掘的基本知識和理論、協同過濾、內容過濾及分類、算法評估、樸素貝葉斯、非結構化文本分類以及聚類等內容。本書采用“在實踐中學習”的方式,用生動的圖示、大量的錶格、簡明的公式、實用的Python代碼示例,闡釋數據挖掘的知識和技能。每章還給齣瞭習題和練習,幫助讀者鞏固所學的知識。
本書適閤對數據挖掘、數據分析和推薦係統感興趣的程序員及相關領域的從業者閱讀參考;同時,本書也可以作為一本輕鬆有趣的數據挖掘課程教學參考書。
發表於2024-12-22
寫給程序員的數據挖掘實踐指南 2024 pdf epub mobi 電子書 下載
版權歸作者所有,任何形式轉載請聯係作者。 作者:黃藥師(來自豆瓣) 來源:https://www.douban.com/note/587325115/ 第二章,協同過濾——愛你所愛(計算用戶之間有多少共性) 曼哈頓距離(manhattan):各維直接相減(r=1) 歐氏距離(euclidean):利用勾股定理得到(r=2) 上...
評分[麵嚮程序員的數據挖掘指南 · GitBook](https://www.gitbook.com/book/wizardforcel/guide-to-data-mining/details) > 這本書以Creative Commons協議發布,可以免費下載。你可以任意分發這本書的副本,或者重新組織它的內容。也許將來我會提供一本紙質的書籍,不過這裏的在綫...
評分一本小眾的書吧,不過對於初學者來說足夠用瞭,這本書不是講數據挖掘的理論,而是通過生活中的例子講解瞭是數據挖掘,講解瞭數據挖掘中常見的公式,而且通過python編程給齣瞭源代碼。公式的講解不是從數學角度推理,演算,講解的,而是從實用角度齣發,通過例子,通過要解決的...
評分說說這本書的優點吧。 1. 這本書好在節奏上。雖說有300頁,但其實看起來很輕鬆,可以很快看完。而且有一些篇幅直接是放的代碼,較真的人可能覺得有點浪費紙張,但這樣可以脫離操作電腦專注在書本上,還能對代碼行寫寫畫畫做筆記。 2. 看這本書沒有壓力。所有的問題讓你想一想後...
評分說說這本書的優點吧。 1. 這本書好在節奏上。雖說有300頁,但其實看起來很輕鬆,可以很快看完。而且有一些篇幅直接是放的代碼,較真的人可能覺得有點浪費紙張,但這樣可以脫離操作電腦專注在書本上,還能對代碼行寫寫畫畫做筆記。 2. 看這本書沒有壓力。所有的問題讓你想一想後...
圖書標籤: 數據挖掘 Python 機器學習 編程 計算機科學 入門 計算機 數據分析
寫得非常細,有數據,有代碼,有測試,容易上手。
評分寫得非常細,有數據,有代碼,有測試,容易上手。
評分快速瞭解
評分sklearn裏很多東西都實現瞭。
評分語言很有親和力,不論有沒有數據挖掘或者寫代碼的經曆都很適閤讀,不過畢竟是入門讀物,涵蓋的麵很有限。
寫給程序員的數據挖掘實踐指南 2024 pdf epub mobi 電子書 下載