Kudu:构建高性能实时数据分析存储系统

Kudu:构建高性能实时数据分析存储系统 pdf epub mobi txt 电子书 下载 2025

出版者:电子工业出版社
作者:【美】吉恩-马克·斯帕加里(Jean-Marc Spaggiari) 等
出品人:
页数:192
译者:常冰琳
出版时间:2019-3
价格:69.00元
装帧:平装
isbn号码:9787121295416
丛书系列:
图书标签:
  • 大数据
  • 存储
  • kudu
  • 技术
  • Kudu
  • 实时数据分析
  • 存储系统
  • 大数据
  • 高性能
  • 分布式系统
  • Apache Kudu
  • 数据工程
  • 数据架构
  • 技术栈
想要找书就要到 本本书屋
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

要在Hadoop生态系统中实现数据的快速输入和快速分析,一直以来只有少数可用但是不够完美的解决方案。它们要么以缓慢的数据输入为代价实现快速分析,要么以缓慢的分析为代价实现快速的数据输入。这个问题现在有了解决办法,使用Apache Kudu基于列的数据存储,可以很容易地对快速输入的数据进行快速的分析。这就是本书的内容。

在《Kudu:构建高性能实时数据分析存储系统》中,你将学习Kudu设计中的关键概念,以及如何用它构建快速、可扩展和可靠的应用程序。通过实际的示例,你将了解Kudu是如何与其他Hadoop生态系统组件(如Apache Spark、Spark SQL和Impala)集成的。

《Kudu:构建高性能实时数据分析存储系统》适合大数据系统的架构师、开发者和咨询师阅读。

作者简介

目录信息

前言 ............................................................................... XIII
第1 章 为什么会有Kudu ..................................................1
Kudu 为什么重要 .................................................................................... 1
易用性驱动接纳度 .................................................................................. 2
新的应用场景 ......................................................................................... 5
物联网 ...........................................................................................................5
现有的实时分析方案 .....................................................................................7
实时处理 .....................................................................................................13
硬件环境 ............................................................................................... 15
Kudu 在大数据生态中的独特位置 ........................................................ 17
与其他生态系统的组件对比 .......................................................................19
与大数据组件对比——HDFS、HBase 和Cassandra ..................................24
小结 ...................................................................................................... 26
第2 章 Kudu 简介 ..........................................................27
Kudu 的高层设计 .................................................................................. 29
Kudu 中的角色 ............................................................................................29
master 服务器 ..............................................................................................31
tablet 服务器................................................................................................32
Kudu 中的概念与机制 .......................................................................... 42
热点 .............................................................................................................42
分区 .............................................................................................................44
第3 章 安装与运行 .........................................................49
安装 ...................................................................................................... 49
使用Kudu Quickstart VM ...........................................................................49
使用Cloudera Manager ...............................................................................51
从源代码构建 ..............................................................................................52
软件包 .........................................................................................................53
Cloudera Quickstart VM ..............................................................................53
快速安装:3 分钟或者更短 .................................................................. 54
小结 ...................................................................................................... 58
第4 章 Kudu 的管理 .......................................................59
为Kudu 做规划 ..................................................................................... 59
master 服务器和tablet 服务器 .....................................................................60
预写日志 .....................................................................................................65
数据服务器和存储 ......................................................................................68
复制策略(replication strategy) ..................................................................69
部署时的注意事项:是采用新集群还是现有集群 ................................ 70
全新的仅有Kudu 的集群 ............................................................................70
全新的包含Kudu 的Hadoop 集群 ..............................................................71
在现有的Hadoop 集群中添加Kudu ...........................................................77
tablet 服务器和master 服务器的Web UI .............................................. 81
master 服务器UI 和tablet 服务器UI ..........................................................82
master 服务器UI .........................................................................................83
tablet 服务器UI ...........................................................................................83
Kudu 命令行接口 .................................................................................. 84
集群 .............................................................................................................84
文件系统 .....................................................................................................86
tablet 副本 ...................................................................................................92
与Raft 一致性相关的元数据.....................................................................106
添加和删除tablet 服务器 .................................................................... 107
添加tablet 服务器 .....................................................................................107
删除tablet 服务器 .....................................................................................108
安全 .................................................................................................... 109
一个简单的类比 ........................................................................................ 110
Kudu 的安全功能 ...................................................................................... 112
基本的性能调优 .................................................................................. 117
Kudu 的内存限制 ...................................................................................... 117
维护管理器的线程 .................................................................................... 118
监控性能 ................................................................................................... 119
未雨绸缪,远离麻烦 .......................................................................... 119
避免耗尽磁盘空间 .................................................................................... 119
容忍磁盘故障 ............................................................................................120
备份 ...........................................................................................................120
小结 .................................................................................................... 121
第5 章 Kudu 常用的开发接口 .......................................123
客户端API .......................................................................................... 124
Kudu Client(客户端)...............................................................................124
Kudu Table ................................................................................................125
Kudu DDL .................................................................................................125
Kudu 扫描器(Scanner)读取模式 ...........................................................126
C++ API .............................................................................................. 127
Python API .......................................................................................... 130
准备Python 开发环境 ...............................................................................131
使用Python 开发Kudu 应用 .....................................................................131
Java ..................................................................................................... 135
Java 应用 ...................................................................................................137
Spark ................................................................................................... 140
在Impala 中使用Kudu ....................................................................... 145
第6 章 表和模式设计 ...................................................149
模式设计基础 ..................................................................................... 150
在线事务处理/ 在线分析处理混合的模式设计 .................................. 151
Lambda 架构 .............................................................................................151
OLTP/OLAP 拆分 ......................................................................................152
主键和列的设计 .................................................................................. 153
列模式的其他注意事项 .............................................................................154
分区的基础知识 .................................................................................. 160
范围分区 ...................................................................................................161
哈希分区 ...................................................................................................161
模式的更改 ......................................................................................... 162
最佳实践和提示 .................................................................................. 163
分区 ...........................................................................................................163
大对象 .......................................................................................................164
decimal(十进制数)..................................................................................164
不重复的字符串 ........................................................................................165
压缩 ...........................................................................................................165
对象的命名 ................................................................................................165
列的数量 ...................................................................................................165
二进制类型 ................................................................................................166
网络包示例 ......................................................................................... 166
小结 .................................................................................................... 168
第7 章 Kudu 用例 ........................................................169
实时物联网分析 .................................................................................. 169
预测建模 ............................................................................................. 173
多平台混合方案 .................................................................................. 176
关于作者 ........................................................................180
封面图片 ........................................................................182
· · · · · · (收起)

读后感

评分

众所周知,大数据诞生于Google的三篇论文:GFS(2003)、MapReduce(2004)、Bigtable(2006),而Google的另外三篇论文:Caffeine(2009)、Pregel(2010)、Dremel(2010),又开启了大数据的后航海时代。本文结合最近看的关于HBase、Kudu等列式存储,以及OLAP相关书籍,针对...

评分

众所周知,大数据诞生于Google的三篇论文:GFS(2003)、MapReduce(2004)、Bigtable(2006),而Google的另外三篇论文:Caffeine(2009)、Pregel(2010)、Dremel(2010),又开启了大数据的后航海时代。本文结合最近看的关于HBase、Kudu等列式存储,以及OLAP相关书籍,针对...

评分

众所周知,大数据诞生于Google的三篇论文:GFS(2003)、MapReduce(2004)、Bigtable(2006),而Google的另外三篇论文:Caffeine(2009)、Pregel(2010)、Dremel(2010),又开启了大数据的后航海时代。本文结合最近看的关于HBase、Kudu等列式存储,以及OLAP相关书籍,针对...

评分

众所周知,大数据诞生于Google的三篇论文:GFS(2003)、MapReduce(2004)、Bigtable(2006),而Google的另外三篇论文:Caffeine(2009)、Pregel(2010)、Dremel(2010),又开启了大数据的后航海时代。本文结合最近看的关于HBase、Kudu等列式存储,以及OLAP相关书籍,针对...

评分

众所周知,大数据诞生于Google的三篇论文:GFS(2003)、MapReduce(2004)、Bigtable(2006),而Google的另外三篇论文:Caffeine(2009)、Pregel(2010)、Dremel(2010),又开启了大数据的后航海时代。本文结合最近看的关于HBase、Kudu等列式存储,以及OLAP相关书籍,针对...

用户评价

评分

简单介绍

评分

简单介绍

评分

简单介绍

评分

简单介绍

评分

简单介绍

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 onlinetoolsland.com All Rights Reserved. 本本书屋 版权所有