Edward Capriolo:Media6degrees公司系统管理员,他是Apache软件基金会成员,还是Hadoop-Hive项目成员。
Dean Wampler:Think Big Analytics公司总顾问,对大数据问题以及Hadoop和机器学习有专门的研究。
Jason Rutherglen:Think Big Analytics公司软件架构师,对大数据、Hadoop、搜索和安全有专门的研究。
发表于2024-12-22
Programming Hive 2024 pdf epub mobi 电子书
学过Hive, 也算是对自己大数据学习之旅的一个总结吧(如果用过Hadoop, 写过MapReduce, 却不懂Hive感觉是一个缺憾, Hive的代码可以算是一款高质量的MR应用): 从12年至今, 云计算、大数据、VR/AR、人工智能、区块链 ..., 虽然大数据已不再火热, 热搜也被区块链/以太坊取代, 但是任...
评分学过Hive, 也算是对自己大数据学习之旅的一个总结吧(如果用过Hadoop, 写过MapReduce, 却不懂Hive感觉是一个缺憾, Hive的代码可以算是一款高质量的MR应用): 从12年至今, 云计算、大数据、VR/AR、人工智能、区块链 ..., 虽然大数据已不再火热, 热搜也被区块链/以太坊取代, 但是任...
评分 评分《Programming Hive》:2012年10月出版的英文原版书,amazon.cn上可以买到,也可以到amazon.com上直接买,加上运费后价格相同。 Hive的学习资料比较少,官网上的介绍也不全面。这本书基本上是第一本专门介绍Hive的书。我看过后发现比hive官网的信息都要全面。大部分篇幅在说Hi...
评分图书标签: hive hadoop 大数据 Programming Hive O'Reilly 编程 计算机
Hive makes life much easier for developers who work with stored and managed data in Hadoop clusters, such as data warehouses. With this example-driven guide, you'll learn how to use the Hive infrastructure to provide data summarization, query, and analysis - particularly with HiveQL, the query language dialect of SQL. You'll learn how to set up Hive in your environment and optimize its use, and how it interoperates with other tools, such as HBase. You'll also learn how to extend Hive with custom code written in Java or scripting languages. Ideal for developers with prior SQL experience, this book shows you how Hive simplifies many tasks that would be much harder to implement in the lower-level MapReduce API provided by Hadoop.
看这种介绍性的书籍应该翻得更快一点,作为"data engineer"还是应该多去项目的社区里混,多从开发者的角度来了解和熟悉一个项目!Code Base + JIRA应该是更好的方式,不能等别人嚼碎了再喂给你!Hadoop的生态系统越来越好,下一步好好看看Sqoop!
评分Hive工具书,Hive高级特性。
评分对于UDF UDAF介绍过于草率。版本比较旧,新特性没有覆盖。
评分发现一些语句实际运行会出错 描述cluster by可以进行total sorting, 实际不能 好处是文字浅显易懂
评分手册
Programming Hive 2024 pdf epub mobi 电子书