Hive編程指南 2025 pdf epub mobi 電子書 下載
☆☆☆☆☆
簡體網頁||
繁體網頁
Hive編程指南 pdf epub mobi 著者簡介
Edward Capriolo:Media6degrees公司係統管理員,他是Apache軟件基金會成員,還是Hadoop-Hive項目成員。
Dean Wampler:Think Big Analytics公司總顧問,對大數據問題以及Hadoop和機器學習有專門的研究。
Jason Rutherglen:Think Big Analytics公司軟件架構師,對大數據、Hadoop、搜索和安全有專門的研究。
Hive編程指南 pdf epub mobi 圖書描述
Hive編程指南 pdf epub mobi 圖書目錄
第1章基礎知識
1.1Hadoop和MapReduce綜述
1.2Hadoop生態係統中的Hive
1.2.1Pig
1.2.2HBase
1.2.3Cascading、Crunch及其他
1.3Java和Hive:詞頻統計算法
1.4後續事情
第2章基礎操作
2.1安裝預先配置好的虛擬機
2.2安裝詳細步驟
2.2.1裝Java
2.2.2安裝Hadoop
2.2.3本地模式、僞分布式模式和分布式模式
2.2.4測試Hadoop
2.2.5安裝Hive
2.3Hive內部是什麼
2.4啓動Hive
2.5配置Hadoop環境
2.5.1本地模式配置
2.5.2分布式模式和僞分布式模式配置
2.5.3使用JDBC連接元數據
2.6Hive命令
2.7命令行界麵
2.7.1CLI選項
2.7.2變量和屬性
2.7.3Hive中“一次使用”命令
2.7.4從文件中執行Hive查詢
2.7.5hiverc文件
2.7.6使用HiveCLI的更多介紹
2.7.7查看操作命令曆史
2.7.8執行shell命令
2.7.9在Hive內使用Hadoop的dfs命令
2.7.10Hive腳本中如何進行注釋
2.7.11顯示字段名稱
第3章數據類型和文件格式
3.1基本數據類型
3.2集閤數據類型
3.3文本文件數據編碼
3.4讀時模式
第4章HiveQL:數據定義
4.1Hive中的數據庫
4.2修改數據庫
4.3創建錶
4.3.1管理錶
4.3.2外部錶
4.4分區錶、管理錶
4.4.1外部分區錶
4.4.2自定義錶的存儲格式
4.5刪除錶
4.6修改錶
4.6.1錶重命名
4.6.2增加、修改和刪除錶分區
4.6.3修改列信息
4.6.4增加列
4.6.5刪除或者替換列
4.6.6修改錶屬性
4.6.7修改存儲屬性
4.6.8眾多的修改錶語句
第5章HiveQL:數據操作
5.1嚮管理錶中裝載數據
5.2通過查詢語句嚮錶中插入數據
5.3單個查詢語句中創建錶並加載數據
5.4導齣數據
第6章HiveQL:查詢
6.1SELECT…FROM語句
6.1.1使用正則錶達式來指定列
6.1.2使用列值進行計算
6.1.3算術運算符
6.1.4使用函數
6.1.5LIMIT語句
6.1.6列彆名
6.1.7嵌套SELECT語句
6.1.8CASE…WHEN…THEN句式
6.1.9什麼情況下Hive可以避免進行MapReduce
6.2WHERE語句
6.2.1謂詞操作符
6.2.2關於浮點數比較
6.2.3LIKE和RLIKE
6.3GROUPBY語句
6.4JOIN語句
6.4.1INNERJOIN
6.4.2JOIN優化
6.4.3LEFTOUTERJOIN
6.4.4OUTERJOIN
6.4.5RIGHTOUTERJOIN
6.4.6FULLOUTERJOIN
6.4.7LEFTSEMI—JOIN
6.4.8笛卡爾積JOIN
6.4.9map—sideJOIN
6.5ORDERBY和SORTBY
6.6含有SORTBY的DISTRIBUTEBY
6.7CLUSTERBY
6.8類型轉換
6.9抽樣查詢
6.9.1數據塊抽樣
6.9.2分桶錶的輸入裁剪
6.10UNIONALL
第7章HiveQL:視圖
7.1使用視圖來降低查詢復雜度
7.2使用視圖來限製基於條件過濾的數據
7.3動態分區中的視圖和map類型
7.4視圖零零碎碎相關的事情
第8章HiveQL:索引
8.1創建索引
8.2重建索引
8.3顯示索引
8.4刪除索引
8.5實現一個定製化的索引處理器
第9章模式設計
9.1按天劃分的錶
9.2關於分區
9.3唯一鍵和標準化
9.4同一份數據多種處理
9.5對於每個錶的分區
9.6分桶錶數據存儲
9.7為錶增加列
9.8使用列存儲錶
9.8.1重復數據
9.8.2多列
9.9(幾乎)總是使用壓縮
第10章調優
10.1使用EXPLAIN
10.2EXPLAINEXTENDED
10.3限製調整
10.4JOIN優化
10.5本地模式
10.6並行執行
10.7嚴格模式
10.8調整mapper和reducer個數
10.9JVM重用
10.10索引
10.11動態分區調整
10.12推測執行
10.13單個MapReduce中多個GROUPBY
10.14虛擬列
第11章其他文件格式和壓縮方法
11.1確定安裝編解碼器
11.2選擇一種壓縮編/解碼器
11.3開啓中間壓縮
11.4最終輸齣結果壓縮
11.5sequencefile存儲格式
11.6使用壓縮實踐
11.7存檔分區
11.8壓縮:包紮
……
第12章開發
第13章函數
第14章Streaming
第15章自定義Hive文件和記錄格式
第16章Hive的Thrift服務
第17章存儲處理程序和NoSQL
第18章安全
第19章鎖
第20章Hive和Oozie整閤
第21章Hive和亞馬遜網絡服務係統(AWS)
第22章HCatalog
第23章案例研究
術語詞匯錶
· · · · · · (
收起)
下載链接在页面底部
點擊這裡下載
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
發表於2025-01-08
Hive編程指南 2025 pdf epub mobi 電子書 下載
Hive編程指南 2025 pdf epub mobi 電子書 下載
Hive編程指南 2025 pdf epub mobi 電子書 下載
喜欢 Hive編程指南 電子書 的读者还喜欢
Hive編程指南 pdf epub mobi 讀後感
評分
☆☆☆☆☆
學過Hive, 也算是對自己大數據學習之旅的一個總結吧(如果用過Hadoop, 寫過MapReduce, 卻不懂Hive感覺是一個缺憾, Hive的代碼可以算是一款高質量的MR應用): 從12年至今, 雲計算、大數據、VR/AR、人工智能、區塊鏈 ..., 雖然大數據已不再火熱, 熱搜也被區塊鏈/以太坊取代, 但是任...
評分
☆☆☆☆☆
《Programming Hive》:2012年10月齣版的英文原版書,amazon.cn上可以買到,也可以到amazon.com上直接買,加上運費後價格相同。 Hive的學習資料比較少,官網上的介紹也不全麵。這本書基本上是第一本專門介紹Hive的書。我看過後發現比hive官網的信息都要全麵。大部分篇幅在說Hi...
評分
☆☆☆☆☆
本書不錯,是初學者入門必備的參考書本書不錯,是初學者入門必備的參考書本書不錯,是初學者入門必備的參考書本書不錯,是初學者入門必備的參考書本書不錯,是初學者入門必備的參考書本書不錯,是初學者入門必備的參考書本書不錯,是初學者入門必備的參考書本書不錯,是初學者...
評分
☆☆☆☆☆
評分
☆☆☆☆☆
《Programming Hive》:2012年10月齣版的英文原版書,amazon.cn上可以買到,也可以到amazon.com上直接買,加上運費後價格相同。 Hive的學習資料比較少,官網上的介紹也不全麵。這本書基本上是第一本專門介紹Hive的書。我看過後發現比hive官網的信息都要全麵。大部分篇幅在說Hi...
類似圖書 點擊查看全場最低價
出版者:人民郵電齣版社
作者:卡普廖洛 (Edward Capriolo)
出品人:
頁數:318
譯者:曹坤
出版時間:2013-12-1
價格:69
裝幀:平裝
isbn號碼:9787115333834
叢書系列:
圖書標籤:
Hive
大數據
hadoop
數據挖掘
數據分析
HQL
計算機
hive
Hive編程指南 2025 pdf epub mobi 電子書 下載
Hive編程指南 pdf epub mobi 用戶評價
評分
☆☆☆☆☆
把Hive講得很清楚瞭。
評分
☆☆☆☆☆
十分滿足我需求。
評分
☆☆☆☆☆
手冊
評分
☆☆☆☆☆
學過Hive, 也算是對自己大數據學習之旅的一個總結吧(如果用過Hadoop, 寫過MapReduce, 卻不懂Hive感覺是一個缺憾, Hive的代碼可以算是一款高質量的MR應用): 從12年至今, 雲計算、大數據、VR/AR、人工智能、區塊鏈 ..., 雖然大數據已不再火熱, 熱搜也被區塊鏈/以太坊取代, 但是任何一傢有規模的互聯企業, 無不有一套以大數據為中心的解決方案。 Hive的存在也是在大數據領域的一種創新, 他完全不同於Google的設計風格, 但同時市場也告訴我們, Google的也不一定是最好的! 祝福(●・◡・●)ノ♥
評分
☆☆☆☆☆
看看還是能建立一個whole picture
Hive編程指南 2025 pdf epub mobi 電子書 下載