作者介紹
Khaled Tannirhas從1980年開始從事計算機相關工作。他是微軟認證的開發人員(MCSD),他在領導軟件解決方案的開發和實施以及技術演說方麵,擁有20多年技術經驗。如今,他是一名獨立IT谘詢師,並在法國、加拿大的許多大公司擔任基礎設施工程師、高級研發工程師、企業/解決方案架構師等職務。
他在Microsoft .NET、Microsoft服務器係統、Oracle Java技術等領域擁有豐富的經驗,並且熟練駕馭在綫和離綫應用係統設計、係統轉換以及多語言的互聯網/桌麵應用程序開發。
Khaled Tnnirhas總是熱衷於探索和學習新的技術,並基於這些技術在法國、北美、中東等地區尋求商機。他現在擁有一個IT電子實驗室,實驗室中配備瞭很多服務器、監控器、開源電子闆(如Arduino、Netduino、RaspBerry Pi和.Net Gadgeteer),還有一些裝有Windows Phone、Android和iOS操作係統的智能設備。
2012年,他協助組織並齣席瞭法國波爾多大學的復雜數據挖掘國際論壇——EGC 2012。
他還是《RavenDB 2.x Beginner’s Guide》一書的作者。
譯者簡介
範歡動 信息技術領域的一名老兵。1994年獲得電力係統及其自動化專業學士學位。1997年獲得信號與信息處理專業碩士學位。興趣廣泛,涉及技術領域和非技術領域,但大多淺嘗輒止。參與過航天、通信、電子齣版和金融領域的信息處理、軟件架構與開發,以第一作者或閤作者身份擁有三項實用新型專利,並獲得第十八屆北京市優秀青年工程師稱號。曾在佳訊飛鴻電氣股份有限公司、英國雅訊(xarios)北京代錶處、博雲科技等公司擔任産品技術總監。目前,終於把全部的興趣聚焦到瞭數據分析,尤其是大數據分析上,主要目標是利用數據分析手段發現模式,從而降低決策風險、改善産業價值鏈。冀望在大數據時代與讀者一起學習並分享大數據相關技術,共同發掘大數據帶來的價值。
大數據時代,MapReduce的重要性不言而喻。Hadoop作為MapReduce框架的一個實現,受到業界廣泛的認同,並被廣泛部署和應用。盡管Hadoop為數據開發工程師入門和編程提供瞭極大便利,但構造一個真正滿足性能要求的MapReduce程序並不簡單。數據量巨大是大數據工作的現實問題,而對低響應時間的要求則時常睏擾著數據開發工程師。
本書采用原理與實踐相結閤的方式,通過原理講解影響MapReduce性能的因素,透過實例一步步地教讀者如何發現性能瓶頸並消除瓶頸,如何識彆係統薄弱環節並改善薄弱環節,講解過程中融閤瞭作者在優化實踐過程中積纍的豐富經驗,具有很強的針對性。讀完本書,能讓讀者對Hadoop具有更強的駕馭能力,從而構造齣性能最優的MapReduce程序。
Hadoop性能問題既是程序層麵的問題,也是係統層麵的問題。本書既覆蓋瞭係統層麵的優化又覆蓋瞭程序層麵的優化,非常適閤Hadoop管理員和有經驗的數據開發工程師閱讀。對於初學者,本書第1章也作瞭必要的技術鋪墊,避免對後麵章節的理解産生梯度。
發表於2024-12-19
Hadoop MapReduce性能優化 2024 pdf epub mobi 電子書 下載
圖書標籤: Hadoop 編程 程序設計 性能優化 性能 大數據 MapReduce
一本隻有90頁小冊子,能獲得一些啓發。
評分錯誤:P67第二行 應該是 Map output records P53 圖5-3 percent拼錯 P54 錶5-1 tasktracker拼錯 p62 錶5-3 reducer數這列26.25≈26
評分雖然是講的Hadoop1,不過仍舊給我一些啓發。從mapreduce的每個階段去分析和優化是一個很好的方法
評分雖然是講的Hadoop1,不過仍舊給我一些啓發。從mapreduce的每個階段去分析和優化是一個很好的方法
評分一本隻有90頁小冊子,能獲得一些啓發。
Hadoop MapReduce性能優化 2024 pdf epub mobi 電子書 下載