本書是您縱情享用數據之美的得力助手。作為處理海量數據集的理想工具,Apache Hadoop架構是MapReduce算法的一種開源應用,是Google(榖歌)開創其帝國的重要基石。本書內容豐富,展示瞭如何使用Hadoop構建可靠、可伸縮的分布式係統,程序員可從中探索如何分析海量數據集,管理員可以瞭解如何建立與運行Hadoop集群。.
本書完全通過案例學習來展示如何用Hadoop解決特殊問題,它將幫助您:
使用Hadoop分布式文件係統(HDFS)來存儲海量數據集,通過MapReduce對這些數據集運行分布式計算..
熟悉Hadoop的數據和I/O構件,用於壓縮、數據集成、序列化和持久處理
洞悉編寫MapReduce實際應用程序時常見陷阱和高級特性
設計、構建和管理專用的Hadoop集群或在雲上運行Hadoop
使用Pig這種高級的查詢語言來處理大規模數據
利用HBase這個Hadoop數據庫來處理結構化和半結構化數據
學習Zookeeper,這是一個用於構建分布式係統的協作原語工具箱
如果您擁有海量數據,無論是GB級還是PB級,Hadoop都是完美的選擇。本書是這方麵最全麵的參考。
發表於2024-12-22
Hadoop權威指南(中文版) 2024 pdf epub mobi 電子書 下載
中文版412頁: 所以理論上,任何東西都可以錶示成二進製形式,然後轉化成為長整型的字符串或直接對數據結構進行序列化,來作為鍵值。 原文460頁: ..., so theoretically anything can serve as row key, from strings to binary representations of long or even serialized ...
評分 評分看瞭幾章中文版的,各種錯誤,太低級,實在是看不下去瞭。 建議還是看原版吧。 譯者們的臉皮可真厚,英文譯不明白也就罷瞭,中文都組織的不通順,好意思嗎!! 什麼叫 “但是,......,但是”啊,“但是體”啊。
評分其實也不算全部讀完瞭,讀它主要是為瞭技術選型,考慮升級持久層架構、提高係統可擴展性,仔細研讀瞭前幾章,對Hadoop、MapReduce、HDFS的模型、機製、使用場景有瞭一定瞭解。後麵幾章及其生態圈內的其他項目抱著瞭解的心態簡單瀏覽瞭一下。整體感覺還行,至少從我看過的章節來...
評分很好的Hadoop教程,比Apache和Yahoo !網頁版guide詳細很多,很多想不明白的Hadoop實現細節都可以在這本書裏找到。
圖書標籤: hadoop 分布式 雲計算 mapreduce Hadoop權威指南 計算機 大數據 O'Reilly
開源東西變化太快瞭,這本書的內容對應現在2.×版本來說有點兒裏力不從心瞭。
評分自學研究Hadoop的第一本教材
評分作為在國內很少能見到的hadoop書籍之一,學習hadoop是必讀的。
評分還是要讀中文啊
評分翻譯爛加上過時瞭
Hadoop權威指南(中文版) 2024 pdf epub mobi 電子書 下載