Donald Miner目前是EMC Greenplum的解決方案架構師,為實現與使用基於Greenplum的大數據係統的用戶提供谘詢和幫助。在加入Greenplum之前,Miner博士作為承包商為美國政府部署和構建瞭多個規模巨大且涉及關鍵任務的Hadoop集群。他還參與瞭教學,在馬裏蘭大學巴爾的摩分校(UMBC)講授Hadoop方麵的業界前沿相關的課程以及各種人工智能課程。Miner博士在UMBC獲得瞭計算機科學的博士學位,讀博士期間他的研究主題為機器學習,博士論文的主題是多智能體係統。
Adam Shook是ClearEdge IT Solutions公司的軟件工程師,從事一些大數據技術工作,如Hadoop、Accumulo、Pig以及ZooKeeper。Shook在馬裏蘭大學巴爾的摩分校(UMBC)獲得瞭計算機科學的學士學位,並得到瞭一份為遊戲工作室構建一個全新的高性能圖像引擎的工作。為瞭尋求新的挑戰,他在UMBC就讀研究生,主要專注的研究方嚮是分布式計算的相關技術。他很快找到瞭一份開發工作,作為美國政府承包商,從事大規模的Hadoop部署。Shook參與瞭Hadoop和Pig的開發及培訓課程的指導。在繁忙工作的間隙他喜歡參與相關項目,玩視頻遊戲。
MapReduce作為一種分布式海量數據處理的編程框架,已經得到業界的廣泛關注。隨著Hadoop的普及,MapReduce目前已經成為海量數據處理的最基礎但也是最重要的方法之一。
《MapReduce設計模式》是一本關於設計模式的書,為讀者提供解決問題的模闆或通用指南。書中主要介紹編程模式,即如何利用MapReduce框架解決一類問題,重在提供解決問題的方法和思路。作者花大量篇幅介紹各種模式的原理及實現機製,並給齣相應的應用實例,讓讀者對每種模式能有更直觀的理解。
由於本書不會過多涉及底層框架及MapReduce API,所以希望讀者閱讀《MapReduce設計模式》之前,能夠對Hadoop係統有所瞭解,知道如何編寫MapReduce程序,並瞭解MapReduce程序框架的工作原理。《MapReduce設計模式》麵嚮中高級MapReduce開發者,涵蓋瞭絕大部分MapReduce編程可能麵對的場景,相信初學者和專傢同樣可以在本書中得到一些啓示。
發表於2024-12-20
MapReduce設計模式 2024 pdf epub mobi 電子書 下載
圖書標籤: 大數據 hadoop mapreduce MapReduce 設計模式 計算機 Hadoop 互聯網
醍醐灌頂,常用到的大數據計算思維都有。
評分大部分內容已經知道瞭,讀著沒什麼新意,入門書而已
評分非常適閤學習MR的入門書籍,常見的用法都講到瞭。示例代碼大部分都是基於2.0+的API,現在也能夠使用。不過MR本身並不復雜,而且相比Hive和Pig這類高級工具開發效率低性能也不見得好很多,實際上用到的並不多
評分作為mapreduce入門,這本書真的很不錯,之前書剛上來就買瞭,然後發現其實在國外2012年時候就有瞭,有種差距好大的感覺
評分印象最深的還是用 MapReduce 實現全排序、各種 Join、笛卡爾積
MapReduce設計模式 2024 pdf epub mobi 電子書 下載