作者:(美)托馬茲·卓巴斯 作者:丹尼·李 譯者:欒雲傑 譯者:陳瑤 譯者:劉旭斌
托馬茲·卓巴斯(Tomasz Drabas),微軟數據科學傢,他擁有超過13年的數據分析經驗。托馬茲每天都和大數據打交道,解決機器學習問題(如異常檢測、流失預測),並使用Spark進行模式識彆。丹尼·李(Denny Lee),微軟Azure DocumentDB團隊的首席項目經理。他是一個經驗豐富的分布式係統和數據科學工程師,擁有超過18年的經驗,擅長開發互聯網級彆基礎架構、數據平颱和預測分析係統(包括內部部署和雲環境)。
本文從Spark的基本特點齣發,藉助大量例子詳細介紹瞭如何使用Python調用Spark新特性、處理結構化及非結構化數據、使用PySpark中基本可用數據類型、生成機器學習模型、進行圖像操作以及閱讀串流數據等新興技術內容。
發表於2024-11-16
PySpark實戰指南 2024 pdf epub mobi 電子書 下載
利用Python和Spark構建大規模數據的分析與挖掘, 如何使用Python來調用Spark的新特性; 如何處理結構化和非結構化的數據; 如何使用PySpark中一些基本的可用數據類型; 如何生成機器學習模型; 將會全麵介紹PySpark各個包的使用方法。 目前我看到過最好地一本介紹PySpark中文圖...
評分利用Python和Spark構建大規模數據的分析與挖掘, 如何使用Python來調用Spark的新特性; 如何處理結構化和非結構化的數據; 如何使用PySpark中一些基本的可用數據類型; 如何生成機器學習模型; 將會全麵介紹PySpark各個包的使用方法。 目前我看到過最好地一本介紹PySpark中文圖...
評分利用Python和Spark構建大規模數據的分析與挖掘, 如何使用Python來調用Spark的新特性; 如何處理結構化和非結構化的數據; 如何使用PySpark中一些基本的可用數據類型; 如何生成機器學習模型; 將會全麵介紹PySpark各個包的使用方法。 目前我看到過最好地一本介紹PySpark中文圖...
評分利用Python和Spark構建大規模數據的分析與挖掘, 如何使用Python來調用Spark的新特性; 如何處理結構化和非結構化的數據; 如何使用PySpark中一些基本的可用數據類型; 如何生成機器學習模型; 將會全麵介紹PySpark各個包的使用方法。 目前我看到過最好地一本介紹PySpark中文圖...
評分利用Python和Spark構建大規模數據的分析與挖掘, 如何使用Python來調用Spark的新特性; 如何處理結構化和非結構化的數據; 如何使用PySpark中一些基本的可用數據類型; 如何生成機器學習模型; 將會全麵介紹PySpark各個包的使用方法。 目前我看到過最好地一本介紹PySpark中文圖...
圖書標籤: spark python 大數據 bigData 計算機 數據 而知也無涯-2019 互聯網
其實我就想知道這是個啥,自己虛擬機配瞭個pyspark,照著書練一練,目的達到瞭
評分翻譯得實在是太差瞭。
評分翻譯真的是巨差
評分github上有代碼
評分原書三星, 譯者英語和專業知識都不行.
PySpark實戰指南 2024 pdf epub mobi 電子書 下載