高彥傑 畢業於中國人民大學,就職於IBM,精通Hadoop相關技術,較早接觸並使用Spark,對Spark應用開發、Spark係統的運維和測試比較熟悉,深度閱讀瞭Spark的源代碼,瞭解Spark的運行機製,擅長Spark的查詢優化。
《Spark大數據處理:技術、應用與性能優化》根據最新技術版本,係統、全麵、詳細講解Spark的各項功能使用、原理機製、技術細節、應用方法、性能優化,以及BDAS生態係統的相關技術。
作為一個基於內存計算的大數據並行計算框架,Spark不僅很好地解決瞭數據的實時處理問題,而且保證瞭高容錯性和高可伸縮性。具體來講,它有如下優勢:
打造全棧多計算範式的高效數據流水綫
輕量級快速處理
易於使用,支持多語言
與HDFS等存儲層兼容
社區活躍度高
……
Spark已經在全球範圍內廣泛使用,無論是Intel、Yahoo!、Twitter、阿裏巴巴、百度、騰訊等國際互聯網巨頭,還是一些尚處於成長期的小公司,都在使用Spark。本書作者結閤自己在微軟和IBM實踐Spark的經曆和經驗,編寫瞭這本書。站著初學者的角度,不僅係統、全麵地講解瞭Spark的各項功能及其使用方法,而且較深入地探討瞭Spark的工作機製、運行原理以及BDAS生態係統中的其他技術,同時還有一些可供操作的案例,能讓沒有經驗的讀者迅速掌握Spark。更為重要的是,本書還對Spark的性能優化進行瞭探討。
發表於2024-11-18
Spark大數據處理:技術、應用與性能優化 2024 pdf epub mobi 電子書 下載
豆瓣的得分充分說明瞭問題,書不好,錯誤挺多的,說明作者一是不認真不尊重知識,二是水平格局有限。如果想深入瞭解而不被誤導,不要讀這本書瞭,誤人子弟。
評分有誤,比如join,spark中的join是inner join,書中對著源碼講成瞭outer join.. 跑題,花瞭大量篇幅在FIFO,HASHMap的原理上... 以上 不過很多地方還是很詳細的,而且通俗易懂
評分有誤,比如join,spark中的join是inner join,書中對著源碼講成瞭outer join.. 跑題,花瞭大量篇幅在FIFO,HASHMap的原理上... 以上 不過很多地方還是很詳細的,而且通俗易懂
評分豆瓣的得分充分說明瞭問題,書不好,錯誤挺多的,說明作者一是不認真不尊重知識,二是水平格局有限。如果想深入瞭解而不被誤導,不要讀這本書瞭,誤人子弟。
評分有誤,比如join,spark中的join是inner join,書中對著源碼講成瞭outer join.. 跑題,花瞭大量篇幅在FIFO,HASHMap的原理上... 以上 不過很多地方還是很詳細的,而且通俗易懂
圖書標籤: 大數據 spark Spark 性能優化 計算機 Scala 編程 數據處理
計算機科學
評分讀過主要部分,主要原理敘述很詳盡。Spark最近在互聯網公司應用越來越多,算子易用性很強。(機器學習讀書會2015.10開始讀的書)
評分瀏覽瞭第4章 ...
評分朋友的書,支持一下~
評分錯誤有點多 居然沒有找到網上勘誤
Spark大數據處理:技術、應用與性能優化 2024 pdf epub mobi 電子書 下載