数据分析:R语言实战

数据分析:R语言实战 pdf epub mobi txt 电子书 下载 2026

出版者:电子工业出版社
作者:李诗羽
出品人:
页数:336页
译者:
出版时间:2014-8-1
价格:59.00元
装帧:平装
isbn号码:9787121237140
丛书系列:
图书标签:
  • 数据分析
  • R
  • R语言
  • 统计学
  • 统计
  • 编程
  • 数据处理
  • 数据挖掘
  • 数据分析
  • R语言
  • 统计分析
  • 数据挖掘
  • 机器学习
  • 数据可视化
  • R语言实战
  • 商业分析
  • 数据科学
  • 编程
想要找书就要到 本本书屋
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

大数据时代,数据成为决策最为重要的参考之一,数据分析行业迈入了一个全新的阶段。R是一款非常优秀的统计分析软件,《数据分析:R语言实战》侧重于使用R进行数据的处理、整理和分析,重点讲述了R的数据分析流程、算法包的使用以及相关工具的应用,同时结合大量精选的数据分析问题对R软件进行科学、准确和全面的介绍,以便使读者能深刻理解R的精髓和灵活、高效的使用技巧。

通过《数据分析:R语言实战》,读者不仅能掌握使用R及相关的算法包来快速解决实际问题,而且能学会从实际问题分析入手,到利用R进行求解,以及对结果进行分析。

《数据分析:R语言实战》可作为计算机、互联网、机器学习、信息、数学、经济金融、管理、运筹、统计以及有关理工科专业的本科生、研究生的学习用书,也能帮助市场营销、金融、财务、人力资源管理人员及产品经理解决实际问题,还能帮助从事咨询、研究、分析行业的人士及各级管理人员提高专业水平。

作者简介

目录信息

第0章 致敬,R! 1
致敬,肩膀! 1
致敬,时代! 3
致敬,人才! 3
致敬,R瑟! 5
上篇 数据分析的前期准备
第1章 数据分析导引 8
1.1 数据分析概述 8
1.1.1 数据分析的原则 8
1.1.2 数据分析的步骤 9
1.1.3 数据分析的过程 10
1.1.4 数据分析的对象 11
1.2 大数据分析 11
1.2.1 大数据分析的流程 11
1.2.2 大数据分析的基本方面 12
1.2.3 大数据分析的应用 13
1.3 数据分析常用工具 13
1.4 R在数据分析中的优势 14
第2章 数据的读取与保存 16
2.1 数据读取 16
2.1.1 读取内置数据集 16
2.1.2 读取文本文件 17
2.1.3 读取固定宽度格式的文件 20
2.1.4 读取Excel数据 21
2.1.5 读取数据库文件 22
2.1.6 读取网页数据 26
2.1.7 读入R格式的文件 28
2.1.8 从其他统计软件读入数据 28
2.2 数据保存 31
2.2.1 使用函数cat() 31
2.2.2 保存为文本文件 32
2.2.3 保存R格式文件 33
2.2.4 保存为其他类型文件 33
第3章 数据预处理 34
3.1 基本函数 34
3.2 数据修改 38
3.2.1 修改数据标签 38
3.2.2 行列删除 38
3.3 缺失值处理 38
3.3.1 判断缺失数据 39
3.3.2 判断缺失模式 39
3.3.3 处理缺失数据 41
3.4 数据整理 44
3.4.1 数据合并 44
3.4.2 选取数据的子集 46
3.4.3 数据排序 47
3.5 长宽格式的转换 48
3.5.1 揉数据函数 48
3.5.2 揉数据的最佳伴侣 49
中篇 基本分析及应用
第4章 数据的图形描述 54
4.1 R绘图概述 54
4.2 绘图区域分割 55
4.2.1 函数par() 55
4.2.2 函数layout() 56
4.2.3 函数split.screen() 57
4.3 二维图形 58
4.3.1 高级绘图函数 58
4.3.2 多元数据绘图 61
4.3.3 低级绘图函数 63
4.3.4 图形美化 64
4.3.5 交互式绘图命令 65
4.4 三维图形 67
4.5 lattice程序包 69
4.6 ggplot2程序包 73
4.6.1 快速绘图 74
4.6.2 分图层绘图 76
4.7 图形保存 84
4.8 实战实例:数据地图 84
第5章 数据的描述性分析 88
5.1 R内置的分布 88
5.2 集中趋势的分析 90
5.2.1 集中趋势的测度 90
5.2.2 R语言实现 91
5.3 离散趋势的分析 93
5.3.1 离散趋势的测度 93
5.3.2 R语言实现 94
5.4 数据的分布分析 95
5.4.1 分布情况的测度 95
5.4.2 R语言实现 96
5.5 图形分析及R实现 97
5.5.1 直方图和密度函数图 97
5.5.2 QQ图 98
5.5.3 茎叶图 100
5.5.4 箱线图 100
5.5.5 经验分布图 102
5.6 多组数据分析及R实现 102
5.6.1 多组数据的统计分析 102
5.6.2 多组数据的图形分析 103
第6章 参数估计及R实现 112
6.1 点估计及R实现 112
6.1.1 矩估计 112
6.1.2 极大似然估计 116
6.2 单正态总体的区间估计 122
6.2.1 均值 的区间估计 122
6.2.2 方差 的区间估计 125
6.3 两正态总体的区间估计 126
6.3.1 均值差 的区间估计 127
6.3.2 两方差比 的区间估计 130
6.4 关于比率的区间估计 131
第7章 假设检验及R实现 134
7.1 假设检验概述 134
7.1.1 理论依据 135
7.1.2 检验步骤 135
7.1.3 两类错误 136
7.2 单正态总体的检验 137
7.2.1 均值 的检验 138
7.2.2 方差 的检验 141
7.3 两正态总体的检验 142
7.3.1 均值差 的检验 143
7.3.2 成对数据的t检验 146
7.3.3 两总体方差的检验 147
7.4 比率的检验 148
7.4.1 比率的二项分布检验 148
7.4.2 比率的近似检验 149
7.5 非参数的检验 149
7.5.1 总体分布的 检验 150
7.5.2 Kolmogrov-Smirnov检验 153
第8章 方差分析及R实现 157
8.1 单因素方差分析及R实现 157
8.1.1 基本假设的检验 157
8.1.2 单因素方差分析 160
8.1.3 多重t检验 164
8.1.4 Kruskal-Wallis秩和检验 166
8.2 双因素方差分析及R实现 168
8.2.1 无交互作用的分析 169
8.2.2 有交互作用的分析 172
8.3 协方差分析及R实现 176
第9章 回归分析及R实现 180
9.1 一元线性回归 180
9.1.1 模型理论 180
9.1.2 显著性检验 181
9.1.3 R语言实现 181
9.2 多元线性回归 187
9.2.1 模型理论 187
9.2.2 显著性检验 188
9.2.3 R语言实现 189
9.2.4 逐步回归 192
9.3 回归诊断及R实现 194
9.3.1 残差诊断 195
9.3.2 影响分析 198
9.3.3 多重共线性诊断 201
9.4 岭回归及R实现 203
9.5 广义线性模型 206
9.5.1 模型理论 206
9.5.2 R语言实现 207
第10章 主成分分析与因子分析 211
10.1 主成分分析 211
10.1.1 理论基础 211
10.1.2 R语言实现 215
10.2 因子分析 221
10.2.1 理论模型 221
10.2.2 因子载荷矩阵的估计方法 223
10.2.3 R语言实现 225
第11章 典型相关分析和对应分析 230
11.1 典型相关分析 230
11.1.1 理论基础 230
11.1.2 典型相关分析的应用 232
11.1.3 R语言实现 233
11.2 对应分析 236
11.2.1 理论基础 236
11.2.2 对应分析的步骤 237
11.2.3 R语言实现 238
第12章 判别分析和聚类分析 242
12.1 判别分析及R实现 242
12.1.1 距离判别法 243
12.1.2 距离判别法的R实现 244
12.1.3 Fisher判别法 247
12.1.4 Fisher判别法的R实现 248
12.1.5 贝叶斯判别法 251
12.1.6 贝叶斯判别法的R实现 252
12.2 聚类分析及R实现 252
12.2.1 理论概述 253
12.2.2 R实现举例 254
第13章 时间序列分析及R实现 260
13.1 时间序列的基本分析 260
13.1.1 平稳性与非平稳性 260
13.1.2 R实现的基本步骤 261
13.2 时间序列的分解 262
13.2.1 分解非季节性数据 263
13.2.2 分解季节性数据 265
13.3 指数平滑法预测分析 268
13.3.1 简单指数平滑法 269
13.3.2 残差的白噪声检验 272
13.3.3 Holt指数平滑法 275
13.3.4 Winters指数平滑法 277
13.4 ARIMA模型分析 280
13.4.1 基本思想 280
13.4.2 平稳化处理 281
13.4.3 建模 282
13.4.4 模型的参数估计 284
13.4.5 模型预测及检验 284
下篇 综合实例
第14章 R在金融数据分析中的应用 288
14.1 投资组合最优化实例 288
14.1.1 概述 288
14.1.2 均值-方差模型 289
14.1.3 模拟退火算法 292
14.2 构造投资组合的有效前沿 298
14.2.1 R中的算法包 298
14.2.2 计算分析 298
14.3 股票聚类分析 301
14.3.1 概述 301
14.3.2 K-means聚类分析 302
14.3.3 层次聚类分析 304
第15章 R在数据预测中的应用 306
15.1 回归分析预测 306
15.1.1 概述 306
15.1.2 实战案例 306
15.2 时间序列预测 318
15.2.1 概述 318
15.2.2 实战案例 318
· · · · · · (收起)

读后感

评分

客观点说,满本都是网上抄来的内容。 书的第51页数据预处理部分,最后竟然不全然后就结束了。也不知道编辑怎么审的稿子。 还有抄袭统计之都里面帖子,看了一半都看不动了,花钱买时也没看看豆瓣评论,真是失败啊。 没有深入的讨论,都是点倒为止 基本就是吧函数使用的参数翻译...

评分

客观点说,满本都是网上抄来的内容。 书的第51页数据预处理部分,最后竟然不全然后就结束了。也不知道编辑怎么审的稿子。 还有抄袭统计之都里面帖子,看了一半都看不动了,花钱买时也没看看豆瓣评论,真是失败啊。 没有深入的讨论,都是点倒为止 基本就是吧函数使用的参数翻译...

评分

客观点说,满本都是网上抄来的内容。 书的第51页数据预处理部分,最后竟然不全然后就结束了。也不知道编辑怎么审的稿子。 还有抄袭统计之都里面帖子,看了一半都看不动了,花钱买时也没看看豆瓣评论,真是失败啊。 没有深入的讨论,都是点倒为止 基本就是吧函数使用的参数翻译...

评分

客观点说,满本都是网上抄来的内容。 书的第51页数据预处理部分,最后竟然不全然后就结束了。也不知道编辑怎么审的稿子。 还有抄袭统计之都里面帖子,看了一半都看不动了,花钱买时也没看看豆瓣评论,真是失败啊。 没有深入的讨论,都是点倒为止 基本就是吧函数使用的参数翻译...

评分

客观点说,满本都是网上抄来的内容。 书的第51页数据预处理部分,最后竟然不全然后就结束了。也不知道编辑怎么审的稿子。 还有抄袭统计之都里面帖子,看了一半都看不动了,花钱买时也没看看豆瓣评论,真是失败啊。 没有深入的讨论,都是点倒为止 基本就是吧函数使用的参数翻译...

用户评价

评分

对于我们这些需要在快速迭代环境中工作的工程师来说,效率是王道。这本书在提升工作流效率方面,简直是个宝藏。我以前处理大型数据集时,经常因为内存占用和计算速度慢而焦头烂额,不得不频繁地切换到更底层的语言。但是,这本书里系统地介绍了一系列优化技巧,比如向量化操作的底层逻辑,以及如何合理利用并行计算框架进行加速。作者用具体的“性能对比测试”数据说话,清晰地展示了使用高效编程范式带来的巨大收益。比如,书中对比了两种不同方式处理缺失值的方法,一种慢了将近十倍!这种实实在在的量化对比,比空泛地喊“要高效”要有力得多。此外,书中对数据管道(Data Pipeline)的构建也有独到的见解,强调了代码的可重复性和模块化设计。读完这部分内容,我立即重构了我手头正在进行的一个项目,发现代码量减少了近三分之一,运行时间缩短了百分之七十。这种立竿见影的效果,让我对作者的实战经验深信不疑。

评分

我是一名非统计学背景的市场研究员,过去面对复杂的数据分析任务时,常常感到力不从心,总觉得专业人士的分析结果高深莫测。这本书最吸引我的地方,在于它对统计概念的“去神秘化”处理。作者非常擅长将那些晦涩难懂的数学术语,转化成日常生活中可以理解的场景。比如,解释中心极限定理时,他没有堆砌公式,而是用了模拟投掷骰子的例子,让人恍然大悟,明白了为什么大量随机事件的平均值会趋向正态分布。对于我这种需要频繁与数据团队沟通的人来说,理解这些基础概念至关重要,它让我不再是盲目地接受报告,而是能够提出更有深度的问题,真正参与到决策讨论中去。而且,书中很多案例都贴近商业决策场景,例如客户细分、流失预测等,这些都是我日常工作中直接能用到的工具箱。它搭建起了一座坚实的桥梁,连接了理论的严谨性与商业实践的灵活性。

评分

说实话,我本来以为这又是一本堆砌代码和术语的“技术文档”,但这本书的叙事方式让我刮目相看。它更像是一本关于“如何像数据科学家一样思考”的指南。作者的文笔非常老练,带着一种冷静的洞察力,总能在关键时刻点破行业内的“潜规则”和常见的陷阱。比如,在数据可视化的章节,书中花了大量的篇幅讨论“如何避免误导性的图表”,这在我以往读过的任何一本书里都是不曾深入探讨过的重点。书中强调,数据分析的最终目的是沟通和决策,图表设计不仅仅是美观,更关乎伦理和准确性。我印象最深的是一个关于A/B测试结果解读的案例,作者通过一个看似成功的实验,揭示了样本选择偏差的微妙之处,让我立刻反思了自己过去在项目中的一些草率结论。这本书的深度在于它的批判性思维训练,它教会了我对每一个分析结果都保持一份健康的怀疑,并用更严格的标准去验证假设。这种思维层面的提升,远比学会几个函数库要宝贵得多。

评分

坦白说,市面上关于数据分析的书籍汗牛充栋,但很多都停留在对某个特定软件或工具的表面介绍。这本书的境界显然要高出一筹。它不仅仅是关于“如何操作”,更是关于“为何如此操作”的哲学探讨。我尤其欣赏它对“数据质量”和“模型泛化能力”的反复强调。在当前大数据时代,我们很容易陷入“数据越多越好”的误区,但作者用翔实的篇幅论证了“坏数据输入,坏结果输出”的铁律。书中对异常值检测和数据清洗流程的描述,细致到了连数据源的编码问题都考虑进去了,这种对细节的极致追求,体现了作者极高的专业素养。读完后,我感觉自己的数据素养得到了一个质的飞跃,从一个单纯的数据使用者,变成了一个能够审视和构建数据分析系统的角色。这本书的价值,在于它能让你建立起一套稳健、可信赖的数据分析方法论,而不是仅仅学会一堆临时的“小窍门”。

评分

这本书的内容简直是为我量身定制的!我之前接触过一些编程语言,但总感觉在数据处理这块总缺点火候。翻开这本书,首先映入眼帘的是那种扎实的理论基础,它不像市面上很多快餐式的教程那样只教你敲代码,而是深入浅出地讲解了背后的统计学原理和算法逻辑。举个例子,书中关于回归分析那几章,我以前总觉得那些公式看得头疼,但作者用非常生动的比喻和清晰的图示,让我一下子就明白了残差的意义和模型拟合的好坏标准。更绝的是,它并没有止步于理论,而是紧接着提供了大量真实世界的数据集案例。我跟着书中的步骤一步步操作,从数据清洗、探索性分析到最终的模型构建和结果可视化,整个过程行云流水。特别是关于时间序列分析的那部分,作者介绍的几种经典模型,比如ARIMA和GARCH,讲解得非常透彻,让我对预测未来的波动性有了全新的认识。这本书的排版也很舒服,代码块的注释清晰明了,即便是初学者也能很快上手。可以说,它不仅仅是一本工具书,更像是一位经验丰富的数据科学导师在身旁指导。

评分

真活泼

评分

真活泼

评分

数学知识比较少,但很好上手。

评分

真活泼

评分

中规中矩的感觉

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2026 onlinetoolsland.com All Rights Reserved. 本本书屋 版权所有