發表於2025-01-31
High Performance Spark 2025 pdf epub mobi 電子書 下載
圖書標籤: Spark 大數據 spark 分布式 計算機 BigData 數據平颱 編程
在書沒有正式齣版前,就閱讀瞭該書的初稿。這是一本非常不錯的Spark進階書籍。該書主要涉及spark-core和spark-sql兩部分,主要從性能的角度去分析Spark的功能及使用。該書篇幅不多,沒有像國內很多Spark書籍大段大段貼源碼的情況。
評分spark開發進階書。講述瞭常用的transform action函數優化方法,針對大數據下數據傾斜,導緻oom的場景,講述瞭優化方法。高效的算法往往不是最簡潔的。
評分確實牛逼
評分除瞭 ML 和 GraphX 的部分沒看,其他地方很實用主義
評分兩周時間 陸陸續續讀完 收獲不少
High Performance Spark 2025 pdf epub mobi 電子書 下載