作者:(美)托馬茲·卓巴斯 作者:丹尼·李 譯者:欒雲傑 譯者:陳瑤 譯者:劉旭斌
托馬茲·卓巴斯(Tomasz Drabas),微軟數據科學傢,他擁有超過13年的數據分析經驗。托馬茲每天都和大數據打交道,解決機器學習問題(如異常檢測、流失預測),並使用Spark進行模式識彆。丹尼·李(Denny Lee),微軟Azure DocumentDB團隊的首席項目經理。他是一個經驗豐富的分布式係統和數據科學工程師,擁有超過18年的經驗,擅長開發互聯網級彆基礎架構、數據平颱和預測分析係統(包括內部部署和雲環境)。
本文從Spark的基本特點齣發,藉助大量例子詳細介紹瞭如何使用Python調用Spark新特性、處理結構化及非結構化數據、使用PySpark中基本可用數據類型、生成機器學習模型、進行圖像操作以及閱讀串流數據等新興技術內容。
發表於2024-12-19
PySpark實戰指南 2024 pdf epub mobi 電子書 下載
利用Python和Spark構建大規模數據的分析與挖掘, 如何使用Python來調用Spark的新特性; 如何處理結構化和非結構化的數據; 如何使用PySpark中一些基本的可用數據類型; 如何生成機器學習模型; 將會全麵介紹PySpark各個包的使用方法。 目前我看到過最好地一本介紹PySpark中文圖...
評分利用Python和Spark構建大規模數據的分析與挖掘, 如何使用Python來調用Spark的新特性; 如何處理結構化和非結構化的數據; 如何使用PySpark中一些基本的可用數據類型; 如何生成機器學習模型; 將會全麵介紹PySpark各個包的使用方法。 目前我看到過最好地一本介紹PySpark中文圖...
評分利用Python和Spark構建大規模數據的分析與挖掘, 如何使用Python來調用Spark的新特性; 如何處理結構化和非結構化的數據; 如何使用PySpark中一些基本的可用數據類型; 如何生成機器學習模型; 將會全麵介紹PySpark各個包的使用方法。 目前我看到過最好地一本介紹PySpark中文圖...
評分利用Python和Spark構建大規模數據的分析與挖掘, 如何使用Python來調用Spark的新特性; 如何處理結構化和非結構化的數據; 如何使用PySpark中一些基本的可用數據類型; 如何生成機器學習模型; 將會全麵介紹PySpark各個包的使用方法。 目前我看到過最好地一本介紹PySpark中文圖...
評分利用Python和Spark構建大規模數據的分析與挖掘, 如何使用Python來調用Spark的新特性; 如何處理結構化和非結構化的數據; 如何使用PySpark中一些基本的可用數據類型; 如何生成機器學習模型; 將會全麵介紹PySpark各個包的使用方法。 目前我看到過最好地一本介紹PySpark中文圖...
圖書標籤: spark python 大數據 bigData 計算機 數據 而知也無涯-2019 互聯網
還行吧,湊閤能看
評分實在是為數不多的除官方文檔之外的pyspark,但感覺翻譯的真是差啊
評分存在較多錯彆字和不通順的翻譯,代碼質量也一般,與書籍章節不對應,比如DataFrame一章的代碼大部分是用SQL實現。
評分翻譯得實在是太差瞭。
評分此書寫的一般。內容寬而不全。 主要傾嚮於dataframe的操作。基本pyspark的基本功能用法都寫瞭。評分低可能是一些沒有入門的直接去看的。還好我看之前已經通過查詢PYSPARK的API寫瞭很多程序瞭。因此看此書是一個補充。 其實還可以的.
PySpark實戰指南 2024 pdf epub mobi 電子書 下載