发表于2025-03-03
High Performance Spark 2025 pdf epub mobi 电子书
图书标签: Spark 大数据 spark 分布式 计算机 BigData 数据平台 编程
spark开发进阶书。讲述了常用的transform action函数优化方法,针对大数据下数据倾斜,导致oom的场景,讲述了优化方法。高效的算法往往不是最简洁的。
评分除了 ML 和 GraphX 的部分没看,其他地方很实用主义
评分目前看到的最全面最有用的讲解spark的书籍
评分在书没有正式出版前,就阅读了该书的初稿。这是一本非常不错的Spark进阶书籍。该书主要涉及spark-core和spark-sql两部分,主要从性能的角度去分析Spark的功能及使用。该书篇幅不多,没有像国内很多Spark书籍大段大段贴源码的情况。
评分目前看到的最全面最有用的讲解spark的书籍
High Performance Spark 2025 pdf epub mobi 电子书