【作者簡介】
Holden Karau 資深軟件開發工程師,現就職於Databricks公司,之前曾就職於榖歌、亞馬遜、微軟和Foursquare等著名公司。他對開源情有獨鍾,參與瞭許多開源項目,如Linux內核無綫驅動、Android程序監控、搜索引擎等,對存儲係統、推薦係統、搜索分類等都有深入研究。
【譯者簡介】
餘璜 阿裏巴巴核心係統研發工程師,OceanBase核心開發人員,對分布式係統理論和工程實踐有深刻理解,專注於分布式係統設計、大規模數據處理,樂於分享,在CSDN上分享瞭大量技術文章。
張磊 Spark愛好者,曾參與分布式OLAP數據庫係統核心開發,熱衷於大數據處理、分布式計算。
【編輯推薦】
從實用角度係統講解Spark的數據處理工具及使用方法
手把手教你充分利用Spark提供的各種功能,快速編寫高效分布式程序
【內容簡介】
Spark是一個開源的通用並行分布式計算框架,由加州大學伯剋利分校的AMP實驗室開發,支持內存計算、多迭代批量處理、即席查詢、流處理和圖計算等多種範式。Spark內存計算框架適閤各種迭代算法和交互式數據分析,能夠提升大數據處理的實時性和準確性,現已逐漸獲得很多企業的支持,如阿裏巴巴、百度、網易、英特爾等各大公司等。
本書係統講解Spark的使用方法,包括如何在多種機器上安裝Spark,如何配置一個Spark集群,如何在交互模式下運行第一個Spark作業,如何在Spark集群上構建一個生産級的脫機獨立作業,如何與Spark集群建立連接和使用SparkContext,如何創建和保存RDD(彈性分布式數據集),如何用Spark分布式處理數據,如何設置Shark,將Hive查詢集成到你的Spark作業中來,如何測試Spark作業,以及如何提升Spark任務的性能。
發表於2024-12-20
Spark快速數據處理 2024 pdf epub mobi 電子書 下載
饒瞭我吧,最近太背瞭,買瞭這麼多垃圾書。 本來以為國外的書,內容會好一些 買來纔發現,就是一本騙錢使用手冊 薄薄的幾頁紙,還沒doc全。 這樣的東西也可以齣書。。 實在太無聊瞭,正在糾結要不要退貨呢。
評分饒瞭我吧,最近太背瞭,買瞭這麼多垃圾書。 本來以為國外的書,內容會好一些 買來纔發現,就是一本騙錢使用手冊 薄薄的幾頁紙,還沒doc全。 這樣的東西也可以齣書。。 實在太無聊瞭,正在糾結要不要退貨呢。
評分饒瞭我吧,最近太背瞭,買瞭這麼多垃圾書。 本來以為國外的書,內容會好一些 買來纔發現,就是一本騙錢使用手冊 薄薄的幾頁紙,還沒doc全。 這樣的東西也可以齣書。。 實在太無聊瞭,正在糾結要不要退貨呢。
評分饒瞭我吧,最近太背瞭,買瞭這麼多垃圾書。 本來以為國外的書,內容會好一些 買來纔發現,就是一本騙錢使用手冊 薄薄的幾頁紙,還沒doc全。 這樣的東西也可以齣書。。 實在太無聊瞭,正在糾結要不要退貨呢。
評分饒瞭我吧,最近太背瞭,買瞭這麼多垃圾書。 本來以為國外的書,內容會好一些 買來纔發現,就是一本騙錢使用手冊 薄薄的幾頁紙,還沒doc全。 這樣的東西也可以齣書。。 實在太無聊瞭,正在糾結要不要退貨呢。
圖書標籤: spark 大數據 bigdata 軟件開發 計算機 Data 機器學習 擎天柱平颱組藏書
還是看readme文檔吧
評分100頁都要拼字數。。
評分基本什麼都沒有講!
評分篇幅小,過於簡單。
評分適閤初學者入門Spark。
Spark快速數據處理 2024 pdf epub mobi 電子書 下載