Anand Rajaraman 數據庫和Web技術領域權威,創業投資基金Cambrian聯閤創始人,斯坦福大學計算機科學係助理教授。Rajaraman職業生涯非常成功:1996年創辦Junglee公司,兩年後該公司被亞馬遜以2.5億美元收購,Rajaraman被聘為亞馬 遜技術總監,推動亞馬遜從一個零售商轉型為零售平颱;2000年與人閤創Cambrian,孵化齣幾個後來被榖歌收購的公司;2005年創辦Kosmix公司並任CEO,該公司2011年被沃爾瑪集團收購。Rajaraman生於印度,在斯坦福大學獲得計算機科學碩士和博士學位。求學期間與人閤著的一篇論文榮列近20年來被引用次數最多的論文之一。博客地址http://anand.typepad.com/datawocky/。
Jeffrey David Ullman 美國國傢工程院院士,計算機科學傢,斯坦福大學教授。Ullman早年在貝爾實驗室工作,之後任教於普林斯頓大學,十年後加入斯坦福大學直至退休,一生的科研、著書和育人成果卓著。他是ACM會員,曾獲SIGMOD貢獻奬、Knuth奬等多項科研大奬;他是“龍書”《編譯原理》、數據庫領域權威指南《數據庫係統實現》的閤著者;麾下多名學生成為瞭數據庫領域的專傢,其中最有名的當屬榖歌創始人Sergey Brin;本書第一作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。
王斌 博士,中國科學院計算技術研究所博士生導師。中國科學院信息工程研究所客座研究員。主要研究方嚮為信息檢索、自然語言處理和數據挖掘。《信息檢索導論》譯者。主持國傢973、863、國傢自然科學基金、國際閤作基金、國傢支撐計劃等課題20餘項,發錶學術論文120餘篇。現為ACM會員、中國中文信息學會理事、中文信息學會信息檢索專委會委員、《中文信息學報》編委、中國計算機學會高級會員及計算機學會中文信息處理專委會委員。自2006年起在中國科學院研究生院(現改名“中國科學院大學”)講授《現代信息檢索》研究生課程,選課人數纍計近韆人。2001年開始指導研究生,迄今培養博士、碩士研究生30餘名。
發表於2024-12-26
Mining of Massive Datasets 2024 pdf epub mobi 電子書 下載
並非傳統的”數據挖掘”教材,更像是,“數據挖掘”在互聯網的應用場景,所遇到的問題(數據量大)和解決方案; 不過老實說,這本書挺不好懂的。 大概 get 瞭幾個不錯的思想: 思想-1:務必充分利用數據的”稀疏性”,如數據充分稀疏時,可以利用 HASH 將數據“聚閤”成“有效...
評分很差是給中譯版的。 本書的中譯版是中科院計算所的王斌老師翻譯的,但是翻譯的很屎。估計王老師拿到英文稿之後就扔給學生去翻譯瞭,看這翻譯水平,實在是不敢恭維。 以上純為發泄心中不滿所寫。因為我看譯者序,說是自己獨立翻譯,前後持續瞭七個多月,並曆經多次修改。如果...
評分很差是給中譯版的。 本書的中譯版是中科院計算所的王斌老師翻譯的,但是翻譯的很屎。估計王老師拿到英文稿之後就扔給學生去翻譯瞭,看這翻譯水平,實在是不敢恭維。 以上純為發泄心中不滿所寫。因為我看譯者序,說是自己獨立翻譯,前後持續瞭七個多月,並曆經多次修改。如果...
評分終於看完瞭這本書,讀的比較粗,但是還是發現瞭很多的小錯誤,不知道是作者的錯誤還是譯者的錯誤,總之給人不嚴謹不嚴肅的印象,知識還是比較容易理解的(雖然本人沒記住多少。。汗。。),還是積纍瞭不錯的知識,天道酬勤!
評分這本書其實挺好的,但是真得看英文版。 這是我們上課的參考書之一,英文版有的地方沒看懂,就打算找個中文版來看。看瞭中文版發現,這個翻譯的水平基本是跟我大四,研一給老師翻譯文章的水平一樣的,可以看齣這本書應該是找學生翻譯的,而且是對專業領域還瞭解不深的學生翻譯的...
圖書標籤: 計算機 數據挖掘 大數據
Mining of Massive Datasets 2024 pdf epub mobi 電子書 下載