本書是您縱情享用數據之美的得力助手。作為處理海量數據集的理想工具,Apache Hadoop架構是MapReduce算法的一種開源應用,是Google(榖歌)開創其帝國的重要基石。本書內容豐富,展示瞭如何使用Hadoop構建可靠、可伸縮的分布式係統,程序員可從中探索如何分析海量數據集,管理員可以瞭解如何建立與運行Hadoop集群。.
本書完全通過案例學習來展示如何用Hadoop解決特殊問題,它將幫助您:
使用Hadoop分布式文件係統(HDFS)來存儲海量數據集,通過MapReduce對這些數據集運行分布式計算..
熟悉Hadoop的數據和I/O構件,用於壓縮、數據集成、序列化和持久處理
洞悉編寫MapReduce實際應用程序時常見陷阱和高級特性
設計、構建和管理專用的Hadoop集群或在雲上運行Hadoop
使用Pig這種高級的查詢語言來處理大規模數據
利用HBase這個Hadoop數據庫來處理結構化和半結構化數據
學習Zookeeper,這是一個用於構建分布式係統的協作原語工具箱
如果您擁有海量數據,無論是GB級還是PB級,Hadoop都是完美的選擇。本書是這方麵最全麵的參考。
發表於2024-11-01
Hadoop權威指南(中文版) 2024 pdf epub mobi 電子書 下載
Cobub Razor APP數據統計分析工具官網上有篇文章是講Hadoop Yarn調度器的選擇和使用的,我覺得寫的挺好的,推薦http://www.cobub.com/the-selection-and-use-of-hadoop-yarn-scheduler/
評分買瞭第一版,時間太緊,沒來得及看,後來齣瞭個號稱修訂升級的第二版,毫不猶豫又買瞭,後來聽說第二版比第一版翻譯得好,心中竊喜,再後來看瞭第二版,我震驚瞭,我TM就是一傻子,放著好好的英文版不看,趕什麼時髦買中文版呢。在這個神奇的國度,牛奶裏放的是三聚氰胺,火腿...
評分 評分 評分很多地方翻譯的不行,需要對照英文看纔能明白。。。不過對於快速學習,仍然是不錯的選擇。建議譯者看看每部分內容的重要性,不重要的瞎翻翻就算瞭,重要的部分還是好好花點功夫,不要本末倒置瞭。比如第三章的數據流部分,這麼經典的地方居然被翻譯爛的一塌糊塗。不知道譯者會...
圖書標籤: hadoop 分布式 雲計算 mapreduce Hadoop權威指南 計算機 大數據 O'Reilly
: TP274/9025
評分作為在國內很少能見到的hadoop書籍之一,學習hadoop是必讀的。
評分這版翻譯不行,看的第二版,學習中
評分這版翻譯不行,看的第二版,學習中
評分翻譯 的很爛,隨便翻瞭翻一些。
Hadoop權威指南(中文版) 2024 pdf epub mobi 電子書 下載