陈欢
腾讯资深程序员,15年编码经验,曾任职网络安全、互联网金融等部门,亲手从零建设了财付通业务的Spark集群,并使之同时支持SQL、实时计算、机器学习等多种数据计算场景。他目前就职于腾讯社交与效果广告部,从事大数据分析工作。
林世飞
腾讯资深研究员,2005年加入腾讯,先后在无线产品、安全中心、搜索平台、开放平台、社交与效果广告部等部门从事开发和团队管理工作。他对网络安全、搜索引擎、数据挖掘、机器学习有一定了解,热衷知识传播和分享,曾获腾讯学院2009年年度优秀讲师。目前,他就职于社交与效果广告部,负责广告系统相关的研发工作。
发表于2025-03-10
Spark最佳实践 2025 pdf epub mobi 电子书
图书标签: spark 大数据 Spark 计算机 技术 没有含量 中国 ~大数据
本书是Spark实战指南,全书共分8章。前4章介绍Spark的部署、工作机制和内核,后4章分别通过实战项目介绍Spark SQL、Spark Streaming、Spark GraphX和Spark MLib功能模块。此外,本书详细介绍了常见的实战问题,比如大数据环境下的配置设置、程序调优等。本书附带的一键安装脚本,更能为初学者提供很大帮助。
说是入门吧,却没把任何一点讲明白,贪大图全;说是高阶吧,却都只涉及皮毛,蜻蜓点水。国人写书真的是乏善可陈。如果没看过《Spark快速大数据分析》,就去看看,而不要看这本;如果已经看过了,就不要看这本。还有封底那些不负责任的推荐者,真不知道他们是不是看了书的内容。
评分说是入门吧,却没把任何一点讲明白,贪大图全;说是高阶吧,却都只涉及皮毛,蜻蜓点水。国人写书真的是乏善可陈。如果没看过《Spark快速大数据分析》,就去看看,而不要看这本;如果已经看过了,就不要看这本。还有封底那些不负责任的推荐者,真不知道他们是不是看了书的内容。
评分这本书写得并不好。。。怎么说呢?我不知道是作者本身不擅长写这种代码讲解的书,还是作者故意模糊了很多需要详细讲解的细节,整本书不通透,肥肠不适合初学者学习。大家看书都是从不懂到懂,为了学习,但是这本书很奇怪,一讲概念就罗里吧嗦;(1-4章难道不是应该一章就完吗???)一讲代码就几句话略过,甚至很多都只给结果,不给过程??excuse me?谁想看你的结果?
评分这本书写得并不好。。。怎么说呢?我不知道是作者本身不擅长写这种代码讲解的书,还是作者故意模糊了很多需要详细讲解的细节,整本书不通透,肥肠不适合初学者学习。大家看书都是从不懂到懂,为了学习,但是这本书很奇怪,一讲概念就罗里吧嗦;(1-4章难道不是应该一章就完吗???)一讲代码就几句话略过,甚至很多都只给结果,不给过程??excuse me?谁想看你的结果?
评分这书写的我只能给三分了。看到连城推荐鹅厂的实践就下单,但是看到集群搭建standalone和yarn模式混为一潭顿时觉得索然无味,坚持读完觉得写的还算是全面,水平入门看看还算有零星收获,书名是入门必备可给四分,称为最佳实践的话只能三分了……
Spark最佳实践 2025 pdf epub mobi 电子书