張良均,高 級信息係統項目管理師,泰迪杯全國大學生數據挖掘競賽(www.tipdm.org)發起人。華南師範大學、廣東工業大學兼職教授,廣東省工業與應用數學學會理事。兼有大型高科技企業和高校的工作經曆,主要從事大數據挖掘及其應用的策劃、研發及谘詢培訓。全國計算機技術與軟件專業技術資格(水平)考試繼續教育和CDA數據分析師培訓講師。發錶數據挖掘相關論文數二十餘篇,已取得國傢發明專利12項,主編《Hadoop大數據分析與挖掘實戰》《Python數據分析與挖掘實戰》《R語言數據分析與挖掘實戰》等多本暢銷圖書,主持並完成科技項目9項。獲得SAS、SPSS數據挖掘認證及Hadoop開發工程師證書,具有電力、電信、銀行、製造企業、電子商務和電子政務的項目經驗和行業背景。
本書以任務為導嚮,較為全麵地介紹瞭Hadoop大數據技術的相關知識。全書共6章,具體內容包括Hadoop介紹、Hadoop集群的搭建及配置、Hadoop基礎操作、MapReduce編程入門、MapReduce進階編程、項目案例:電影網站用戶性彆預測。本書的2~5章包含瞭實訓與課後練習,通過練習和操作實踐,幫助讀者鞏固所學的內容。
本書可以作為高校大數據技術類專業的教材,也可作為大數據技術愛好者的自學用書。
發表於2024-11-15
Hadoop大數據開發基礎 2024 pdf epub mobi 電子書 下載
圖書標籤: 編程 大數據 Hadoop
Hadoop是一個由Apache基金會所開發的可靠的、可擴展的用於分布式計算的分布式係統基礎架構和開發開源軟件。Apache Hadoop軟件庫是一個框架,允許使用簡單的編程模型在計算機集群中對大規模數據集進行分布式處理。它的目的是從單一的服務器擴展到成韆上萬的機器,將集群部署在多颱機器中,每颱機器提供本地計算和存儲,並且將存儲的數據備份在多個節點,由此提升集群的可用性,而不是通過硬件提升。當一颱機器宕機時,其他節點依然可以提供備份數據和計算服務。 Hadoop框架最核心的設計是HDFS(Hadoop Distributed File System)和MapReduce。HDFS是可擴展、高容錯、高性能的分布式文件係統,負責數據的分布式存儲和備份,文件寫入後隻能讀取,不能修改。MapRed
評分Hadoop是一個由Apache基金會所開發的可靠的、可擴展的用於分布式計算的分布式係統基礎架構和開發開源軟件。Apache Hadoop軟件庫是一個框架,允許使用簡單的編程模型在計算機集群中對大規模數據集進行分布式處理。它的目的是從單一的服務器擴展到成韆上萬的機器,將集群部署在多颱機器中,每颱機器提供本地計算和存儲,並且將存儲的數據備份在多個節點,由此提升集群的可用性,而不是通過硬件提升。當一颱機器宕機時,其他節點依然可以提供備份數據和計算服務。 Hadoop框架最核心的設計是HDFS(Hadoop Distributed File System)和MapReduce。HDFS是可擴展、高容錯、高性能的分布式文件係統,負責數據的分布式存儲和備份,文件寫入後隻能讀取,不能修改。MapRed
評分Hadoop是一個由Apache基金會所開發的可靠的、可擴展的用於分布式計算的分布式係統基礎架構和開發開源軟件。Apache Hadoop軟件庫是一個框架,允許使用簡單的編程模型在計算機集群中對大規模數據集進行分布式處理。它的目的是從單一的服務器擴展到成韆上萬的機器,將集群部署在多颱機器中,每颱機器提供本地計算和存儲,並且將存儲的數據備份在多個節點,由此提升集群的可用性,而不是通過硬件提升。當一颱機器宕機時,其他節點依然可以提供備份數據和計算服務。 Hadoop框架最核心的設計是HDFS(Hadoop Distributed File System)和MapReduce。HDFS是可擴展、高容錯、高性能的分布式文件係統,負責數據的分布式存儲和備份,文件寫入後隻能讀取,不能修改。MapRed
評分Hadoop是一個由Apache基金會所開發的可靠的、可擴展的用於分布式計算的分布式係統基礎架構和開發開源軟件。Apache Hadoop軟件庫是一個框架,允許使用簡單的編程模型在計算機集群中對大規模數據集進行分布式處理。它的目的是從單一的服務器擴展到成韆上萬的機器,將集群部署在多颱機器中,每颱機器提供本地計算和存儲,並且將存儲的數據備份在多個節點,由此提升集群的可用性,而不是通過硬件提升。當一颱機器宕機時,其他節點依然可以提供備份數據和計算服務。 Hadoop框架最核心的設計是HDFS(Hadoop Distributed File System)和MapReduce。HDFS是可擴展、高容錯、高性能的分布式文件係統,負責數據的分布式存儲和備份,文件寫入後隻能讀取,不能修改。MapRed
評分Hadoop是一個由Apache基金會所開發的可靠的、可擴展的用於分布式計算的分布式係統基礎架構和開發開源軟件。Apache Hadoop軟件庫是一個框架,允許使用簡單的編程模型在計算機集群中對大規模數據集進行分布式處理。它的目的是從單一的服務器擴展到成韆上萬的機器,將集群部署在多颱機器中,每颱機器提供本地計算和存儲,並且將存儲的數據備份在多個節點,由此提升集群的可用性,而不是通過硬件提升。當一颱機器宕機時,其他節點依然可以提供備份數據和計算服務。 Hadoop框架最核心的設計是HDFS(Hadoop Distributed File System)和MapReduce。HDFS是可擴展、高容錯、高性能的分布式文件係統,負責數據的分布式存儲和備份,文件寫入後隻能讀取,不能修改。MapRed
Hadoop大數據開發基礎 2024 pdf epub mobi 電子書 下載