作者:(美)托马兹·卓巴斯 作者:丹尼·李 译者:栾云杰 译者:陈瑶 译者:刘旭斌
托马兹·卓巴斯(Tomasz Drabas),微软数据科学家,他拥有超过13年的数据分析经验。托马兹每天都和大数据打交道,解决机器学习问题(如异常检测、流失预测),并使用Spark进行模式识别。丹尼·李(Denny Lee),微软Azure DocumentDB团队的首席项目经理。他是一个经验丰富的分布式系统和数据科学工程师,拥有超过18年的经验,擅长开发互联网级别基础架构、数据平台和预测分析系统(包括内部部署和云环境)。
发表于2024-12-19
PySpark实战指南 2024 pdf epub mobi 电子书
利用Python和Spark构建大规模数据的分析与挖掘, 如何使用Python来调用Spark的新特性; 如何处理结构化和非结构化的数据; 如何使用PySpark中一些基本的可用数据类型; 如何生成机器学习模型; 将会全面介绍PySpark各个包的使用方法。 目前我看到过最好地一本介绍PySpark中文图...
评分利用Python和Spark构建大规模数据的分析与挖掘, 如何使用Python来调用Spark的新特性; 如何处理结构化和非结构化的数据; 如何使用PySpark中一些基本的可用数据类型; 如何生成机器学习模型; 将会全面介绍PySpark各个包的使用方法。 目前我看到过最好地一本介绍PySpark中文图...
评分利用Python和Spark构建大规模数据的分析与挖掘, 如何使用Python来调用Spark的新特性; 如何处理结构化和非结构化的数据; 如何使用PySpark中一些基本的可用数据类型; 如何生成机器学习模型; 将会全面介绍PySpark各个包的使用方法。 目前我看到过最好地一本介绍PySpark中文图...
评分利用Python和Spark构建大规模数据的分析与挖掘, 如何使用Python来调用Spark的新特性; 如何处理结构化和非结构化的数据; 如何使用PySpark中一些基本的可用数据类型; 如何生成机器学习模型; 将会全面介绍PySpark各个包的使用方法。 目前我看到过最好地一本介绍PySpark中文图...
评分利用Python和Spark构建大规模数据的分析与挖掘, 如何使用Python来调用Spark的新特性; 如何处理结构化和非结构化的数据; 如何使用PySpark中一些基本的可用数据类型; 如何生成机器学习模型; 将会全面介绍PySpark各个包的使用方法。 目前我看到过最好地一本介绍PySpark中文图...
图书标签: spark python 大数据 bigData 计算机 数据 而知也无涯-2019 互联网
本文从Spark的基本特点出发,借助大量例子详细介绍了如何使用Python调用Spark新特性、处理结构化及非结构化数据、使用PySpark中基本可用数据类型、生成机器学习模型、进行图像操作以及阅读串流数据等新兴技术内容。
还行吧,凑合能看
评分存在较多错别字和不通顺的翻译,代码质量也一般,与书籍章节不对应,比如DataFrame一章的代码大部分是用SQL实现。
评分翻译真的是巨差
评分原书三星, 译者英语和专业知识都不行.
评分实在是为数不多的除官方文档之外的pyspark,但感觉翻译的真是差啊
PySpark实战指南 2024 pdf epub mobi 电子书