高彥傑 畢業於中國人民大學,就職於IBM,精通Hadoop相關技術,較早接觸並使用Spark,對Spark應用開發、Spark係統的運維和測試比較熟悉,深度閱讀瞭Spark的源代碼,瞭解Spark的運行機製,擅長Spark的查詢優化。
《Spark大數據處理:技術、應用與性能優化》根據最新技術版本,係統、全麵、詳細講解Spark的各項功能使用、原理機製、技術細節、應用方法、性能優化,以及BDAS生態係統的相關技術。
作為一個基於內存計算的大數據並行計算框架,Spark不僅很好地解決瞭數據的實時處理問題,而且保證瞭高容錯性和高可伸縮性。具體來講,它有如下優勢:
打造全棧多計算範式的高效數據流水綫
輕量級快速處理
易於使用,支持多語言
與HDFS等存儲層兼容
社區活躍度高
……
Spark已經在全球範圍內廣泛使用,無論是Intel、Yahoo!、Twitter、阿裏巴巴、百度、騰訊等國際互聯網巨頭,還是一些尚處於成長期的小公司,都在使用Spark。本書作者結閤自己在微軟和IBM實踐Spark的經曆和經驗,編寫瞭這本書。站著初學者的角度,不僅係統、全麵地講解瞭Spark的各項功能及其使用方法,而且較深入地探討瞭Spark的工作機製、運行原理以及BDAS生態係統中的其他技術,同時還有一些可供操作的案例,能讓沒有經驗的讀者迅速掌握Spark。更為重要的是,本書還對Spark的性能優化進行瞭探討。
發表於2024-12-20
Spark大數據處理:技術、應用與性能優化 2024 pdf epub mobi 電子書 下載
豆瓣的得分充分說明瞭問題,書不好,錯誤挺多的,說明作者一是不認真不尊重知識,二是水平格局有限。如果想深入瞭解而不被誤導,不要讀這本書瞭,誤人子弟。
評分豆瓣的得分充分說明瞭問題,書不好,錯誤挺多的,說明作者一是不認真不尊重知識,二是水平格局有限。如果想深入瞭解而不被誤導,不要讀這本書瞭,誤人子弟。
評分豆瓣的得分充分說明瞭問題,書不好,錯誤挺多的,說明作者一是不認真不尊重知識,二是水平格局有限。如果想深入瞭解而不被誤導,不要讀這本書瞭,誤人子弟。
評分豆瓣的得分充分說明瞭問題,書不好,錯誤挺多的,說明作者一是不認真不尊重知識,二是水平格局有限。如果想深入瞭解而不被誤導,不要讀這本書瞭,誤人子弟。
評分豆瓣的得分充分說明瞭問題,書不好,錯誤挺多的,說明作者一是不認真不尊重知識,二是水平格局有限。如果想深入瞭解而不被誤導,不要讀這本書瞭,誤人子弟。
圖書標籤: 大數據 spark Spark 性能優化 計算機 Scala 編程 數據處理
作為新手入門來說還不錯,內容挺淺的。
評分主要看看第三四章介紹遠離框架,對瞭解框架還是有幫助,但是確實不算深入。
評分朋友的書,支持一下~
評分分布式係統
評分讀過主要部分,主要原理敘述很詳盡。Spark最近在互聯網公司應用越來越多,算子易用性很強。(機器學習讀書會2015.10開始讀的書)
Spark大數據處理:技術、應用與性能優化 2024 pdf epub mobi 電子書 下載