R数据分析——方法与案例详解(双色)

R数据分析——方法与案例详解(双色) pdf epub mobi txt 电子书 下载 2026

出版者:电子工业出版社
作者:方匡南
出品人:
页数:392
译者:
出版时间:2015-2
价格:69.00元
装帧:
isbn号码:9787121252907
丛书系列:
图书标签:
  • 数据分析
  • R
  • 统计学
  • 数据可视化
  • 统计
  • 数据
  • 技术
  • 量化交易
  • R语言
  • 数据分析
  • 统计分析
  • 数据挖掘
  • 案例分析
  • 实战
  • 双色
  • 入门
  • 可视化
  • 机器学习
想要找书就要到 本本书屋
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

《R数据分析——方法与案例详解(双色)》是一本R 语言和数据分析的入门教材,循序渐进、深入浅出,每个知识点尽量从实际的应用案例出发,以问题为导向,在解决问题中学习统计方法、R 语言的基本使用以及编程技巧。

《R数据分析——方法与案例详解(双色)》内容涵盖R 数据结构、函数与优化、抽样模拟、统计分析、假设检验、回归分析、统计绘图和R 包制作等内容。

《R数据分析——方法与案例详解(双色)》的定位是为业界数据分析人员、经济管理类、医学的学生提供方法和程序上的参考,在写作过程中尽量删去比较理论的数学原理,这样能够帮助读者轻松上手学习。

作者简介

目录信息

第 1 章 初识R语言..................................... 1
1.1 什么是R语言........................................ 1
1.2 为什么用R语言.................................... 2
1.3 安装R..................................................... 4
1.4 R扩展包................................................. 4
1.4.1 R扩展包的安装与载入............ 5
1.4.2 R包的使用................................ 6
1.5 R编辑器................................................. 7
1.6 工作空间............................................. 11
第 2 章 数据结构与基本运算.................... 13
2.1 数据类型............................................. 13
2.2 数据对象............................................. 14
2.2.1 向量......................................... 15
2.2.2 矩阵......................................... 21
2.2.3 数组......................................... 31
2.2.4 因子......................................... 32
2.2.5 列表......................................... 33
2.2.6 数据框..................................... 34
2.3 习题..................................................... 36
第 3 章 函数与优化.................................. 38
3.1 常用的R内置函数.............................. 38
3.2 条件控制语句..................................... 38
3.2.1 if/else语句............................... 38
3.2.2 ifelse 语句............................... 39
3.2.3 switch语句............................... 39
3.3 循环语句............................................. 40
3.3.1 for循环.................................... 40
3.3.2 while循环................................ 40
3.3.3 repeat语句............................... 41
3.4 编写自己的函数................................. 41
3.4.1 函数名..................................... 42
3.4.2 关键词function........................ 42
3.4.3 参数......................................... 42
3.4.4 函数体和函数返回值............ 44
3.5 程序调试............................................. 45
3.6 程序运行时间与效率......................... 46
3.7 用R做优化求解.................................. 47
3.7.1 一元函数优化求解................ 48
3.7.2 多元函数优化求解................ 48
3.7.3 约束条件下的优化求解........ 50
3.8 习题..................................................... 52
第 4 章 随机数与抽样模拟........................ 54
4.1 一元随机数的产生............................. 54
4.1.1 均匀分布随机数.................... 54
4.1.2 正态分布随机数.................... 56
4.1.3 指数分布随机数.................... 57
4.1.4 离散分布随机数的生成........ 58
4.1.5 常见分布函数表.................... 59
4.2 多元随机数的生成............................. 61
4.2.1 多元正态分布随机数............ 61
4.2.2 多元正态分布密度函数、分位数与累积概率................ 63
4.2.3 多元t分布随机数................... 64
4.3 随机抽样............................................. 65
4.3.1 放回与无放回抽样................ 65
4.3.2 bootstrap重抽样...................... 66
4.4 统计模拟............................................. 67
4.4.1 几种常见的模拟方法............ 67
4.4.2 模拟函数的建立方法............ 70
4.5 习题..................................................... 73
第 5 章 数据读写与预处理........................ 74
5.1 数据的读入......................................... 74
5.1.1 直接输入数据........................ 74
5.1.2 读R包中的数据...................... 75
5.1.3 从外部文件读入数据............ 75
5.2 写出数据............................................. 79
5.3 数据预处理......................................... 80
5.3.1 变量预处理............................ 81
5.3.2 变量重编码............................ 82
5.3.3 变量重命名............................ 84
5.3.4 变量类型的转换.................... 85
5.3.5 日期变量的变换.................... 86
5.4 缺失数据处理..................................... 87
5.4.1 缺失数据的识别.................... 87
5.4.2 缺失数据的探索与检验........ 88
5.4.3 缺失数据的处理.................... 89
5.5 数据集的合并与拆分......................... 90
5.5.1 数据框的合并与拆分............ 90
5.5.2 数据集的合并........................ 92
5.5.3 数据集的抽取........................ 92
5.6 习题..................................................... 93
第 6 章 探索性数据分析........................... 94
6.1 主要分析工具..................................... 94
6.1.1 探索性数据分析的工具........ 94
6.1.2 数据的类型............................ 98
6.2 单变量数据分析................................. 99
6.2.1 分类型数据............................ 99
6.2.2 数值型数据.......................... 101
6.2.3 离群值探索.......................... 106
6.3 双变量数据分析............................... 109
6.3.1 分类数据对分类数据.......... 109
6.3.2 分类数据对数值型数据...... 111
6.3.3 数值型数据对数值型数据.... 112
6.4 多变量数据分析............................... 115
6.4.1 访问数据框数据.................. 115
6.4.2 多变量数据的分析.............. 118
6.5 习题................................................... 124
第 7 章 参数假设检验............................. 126
7.1 假设检验的思想与步骤................... 126
7.1.1 假设检验的基本思想.......... 126
7.1.2 假设检验的基本步骤.......... 128
7.2 正态总体单样本参数假设检验....... 129
7.2.1 均值的检验.......................... 130
7.2.2 方差检验............................... 132
7.3 正态总体双样本参数假设检验....... 134
7.3.1 双样本方差的检验(方差齐性检验).............. 134
7.3.2 两样本均值检验.................. 135
7.4 比例假设检验................................... 139
7.4.1 单样本比例检验.................. 139
7.4.2 两样本比例检验.................. 141
7.5 习题................................................... 142
第 8 章 非参数假设检验......................... 144
8.1 图示法............................................... 144
8.2 卡方检验........................................... 146
8.2.1 卡方分布(χ 2 distribution)...... 147
8.2.2 卡方拟合优度检验.............. 148
8.2.3 卡方独立性检验.................. 151
8.2.4 卡方两样本同质性检验...... 151
8.3 秩和检验........................................... 152
8.3.1 秩的概念............................... 153
8.3.2 单样本符号秩检验.............. 153
8.3.3 两独立秩和检验.................. 154
8.3.4 多个独立样本的秩和检验.... 155
8.3.5 多个相关样本的秩和检验.... 158
8.4 K-S检验............................................ 160
8.4.1 K-S单样本总体分布验证.... 160
8.4.2 K-S两独立样本同质检验.... 160
8.5 常用正态性检验............................... 162
8.5.1 偏度、峰度检验法.............. 162
8.5.2 Shapiro-Wilk(W检验)..... 163
8.5.3 其他常用正态检验.............. 165
8.6 习题................................................... 167
第 9 章 方差分析.................................... 169
9.1 单因素方差分析............................... 170
9.2 双因素方差分析............................... 174
9.2.1 不考虑交互作用的双因素方差分析.......................... 174
9.2.2 考虑交互作用的双因素分析....................................... 178
9.3 习题................................................... 183
第 10 章 线性回归模型........................... 184
10.1 问题提出......................................... 184
10.2 一元线性回归................................. 185
10.2.1 一元线性回归概述............ 186
10.2.2 一元线性回归的参数估计.... 188
10.2.3 一元线性回归模型的检验.... 195
10.2.4 一元线性回归的预测........ 197
10.2.5 一元线性回归综合案例.... 201
10.3 多元线性回归分析......................... 205
10.3.1 多元线性回归模型及假定.... 206
10.3.2 参数估计............................. 207
10.3.3 模型检验............................. 209
10.3.4 预测..................................... 211
10.3.5 多元线性回归综合案例.... 213
10.4 习题................................................. 218
第 11 章 线性回归模型的扩展................ 220
11.1 多重共线性..................................... 220
11.1.1 问题的提出........................ 220
11.1.2 多重共线性定义及后果..... 222
11.1.3 多重共线性检验................ 222
11.1.4 多重共线性克服................ 225
11.2 异方差性......................................... 229
11.2.1 问题的提出........................ 229
11.2.2 异方差性定义及后果........ 231
11.2.3 异方差性检验.................... 232
11.2.4 异方差性克服.................... 236
11.3 序列相关性..................................... 240
11.3.1 问题的提出........................ 241
11.3.2 序列相关性定义及后果..... 243
11.3.3 序列相关性检验................ 245
11.3.4 序列相关性克服................ 248
11.4 习题................................................. 251
第 12 章 非线性回归分析....................... 254
12.1 问题的提出..................................... 254
12.2 可线性化的非线性回归................. 255
12.2.1 Cobb-Douglas生产函数..... 255
12.2.2 多项式方程模型................ 257
12.2.3 指数函数模型.................... 259
12.3 不可线性化的非线性回归............. 260
12.3.1 非线性模型的参数估计与迭代算法......................... 262
12.3.2 初始值选取........................ 269
12.3.3 收敛性................................. 270
12.4 非线性回归评价和假设检验......... 271
12.4.1 可决系数............................. 271
12.4.2 参数显著性的F 检验....... 271
12.4.3 似然比检验........................ 272
12.5 习题................................................. 274
第 13 章 二元选择模型........................... 275
13.1 问题的提出..................................... 276
13.2 线性概率(LP)模型原理............ 277
13.3 Probit模型原理................................ 279
13.4 Logit模型原理................................. 280
13.5 边际效应分析................................. 281
13.6 最大似然估计(MLE)................. 282
13.7 似然比检验和拟合优度................. 282
13.8 案例分析:经济学教学新方法的效果............................................. 284
13.9 扩展案例:信用卡违约预测分析..... 289
13.9.1 描述性统计........................ 290
13.9.2 模型建立与参数估计........ 291
13.9.3 系数意义与边际分析........ 295
13.9.4 拟合与预测........................ 296
13.9.5 结论与建议........................ 297
13.10 习题............................................... 297
第 14 章 多元选择模型........................... 299
14.1 有序选择模型................................. 299
14.1.1 问题的提出:本科生申请研究生的影响因素........ 300
14.1.2 有序选择模型.................... 300
14.1.3 案例分析:本科生申请研究生的影响因素............ 302
14.2 多元无序Logit模型......................... 304
14.2.1 问题的提出:关于钓鱼模式的选择......................... 304
14.2.2 多元无序Logit模型............ 305
14.2.3 案例分析:关于钓鱼模式的选择............................. 307
14.3 嵌套Logit模型................................. 309
14.3.1 问题的提出:旅行交通方式选择............................. 309
14.3.2 嵌套Logit模型原理............ 310
14.3.3 案例分析:旅行交通方式选择................................. 311
14.4 习题................................................. 313
第 15 章 计数模型与受限因变量模型..... 314
15.1 计数模型......................................... 314
15.1.1 问题的提出:轮船事故的计数数据模型................ 314
15.1.2 计数数据模型的设定........ 316
15.1.3 计数数据模型的估计........ 317
15.2 受限因变量模型............................. 319
15.2.1 截断模型的问题提出........ 319
15.2.2 截断模型原理.................... 319
15.2.3 审查模型问题的提出........ 321
15.2.4 审查模型原理.................... 322
15.2.5 最大似然估计(MLE).... 323
15.3 习题................................................. 328
第 16 章 分位数回归.............................. 330
16.1 问题的提出..................................... 330
16.2 总体分位数和总体中位数............. 332
16.3 经验分位数估计............................. 333
16.4 分位数回归原理............................. 334
16.5 扩展案例:社会保障与城乡家庭消费......................................... 339
16.5.1 问题的提出........................ 339
16.5.2 数据说明............................. 339
16.5.3 实证分析............................. 342
16.5.4 结论与建议........................ 345
16.6 习题................................................. 345
第 17 章 高级统计绘图........................... 346
17.1 绘制地图......................................... 346
17.2 高阶绘图工具——ggplot2............. 355
17.2.1 散点图................................. 355
17.2.2 散点图上添加平滑曲线.... 358
17.2.3 条形图和箱线图................ 360
17.2.4 直方图和密度曲线图........ 362
17.2.5 时间序列图........................ 364
17.2.6 图形标注............................. 365
17.3 三维图形与等高线图..................... 366
17.3.1 三维图形............................. 366
17.3.2 等高图/等高线................... 368
17.4 词云................................................. 369
17.5 散点图矩阵与关系矩阵图............. 370
17.6 马赛克图......................................... 372
17.7 习题................................................. 374
第 18 章 如何制作自己的R包................. 375
18.1 R包基础........................................... 376
18.2 在Windows中制作R包.................... 377
18.3 在RStudio中制作R包...................... 381
18.4 习题................................................. 383
参考文献................................................... 384
· · · · · · (收起)

读后感

评分

评分

评分

评分

评分

用户评价

评分

说实话,我对市面上那些动辄用最新版本R或某个冷门包来编写教材的做法有些警惕,因为版本迭代过快,很容易导致读者在跟随操作时遇到环境配置的各种麻烦。我更青睐那些建立在稳健、常用核心函数基础上的教学内容。我观察到这本书的介绍中强调了方法的通用性,这让我感到一丝安心。对于一个致力于长期使用R进行数据分析的人来说,掌握那些不太容易过时、适用于大多数分析场景的基础工具和逻辑远比追逐最新的“酷炫”包更有价值。我希望这本书能够聚焦于数据分析思维的培养,而不是仅仅教会我如何调用某个特定函数的参数。如果它能清晰地阐述每一步决策背后的统计学或逻辑基础,那么这本书的价值就远超一本单纯的“编程指南”了。

评分

这本书的封面设计简直是一场视觉盛宴,色彩搭配得恰到好处,给人一种既专业又不失活泼的感觉。我尤其欣赏那种双色印刷的处理,不仅使得图表和代码区块的区分更加清晰明了,而且在长时间阅读时,也能有效缓解眼部疲劳。翻开内页,那种纸张的质感也让人爱不释手,油墨的清晰度极高,即便是那些复杂的统计公式,也能看得一清二楚,这对于需要对照书本进行实际操作的读者来说,无疑是一个巨大的加分项。从排版上看,作者在保持信息密度的同时,也留出了足够的空白区域,使得整体阅读体验非常流畅,不会有那种被文字和符号压迫的感觉。这种对细节的精益求精,让我立刻感觉到这不是一本敷衍了事的教材,而是倾注了作者大量心血的作品。我期待着在接下来的学习中,这本书的视觉呈现能持续带给我这样的愉悦感,真正做到图文并茂,让枯燥的数据分析过程变得赏心悦目。

评分

作为一名需要经常向非技术背景的同事汇报工作的人,我深知数据可视化在沟通中的重要性。单纯的数字和表格是无法打动人心的。因此,我非常关注这本书在数据可视化章节的深度和广度。如果它仅仅停留在使用基础的`plot()`函数,那未免有些遗憾。我期待它能详细讲解如何运用更先进的包来创建信息量丰富、视觉冲击力强的图表,比如如何通过精心设计的颜色方案、多面板布局或交互式元素来讲述一个清晰的故事。更重要的是,我希望看到作者不仅展示“如何画图”,还能深入探讨“什么时候该用哪种图”的原则性问题。毕竟,一张错误的图表带来的误导性,可能比没有图表更糟糕。这本书能否帮我将复杂的数据洞察,优雅而准确地传达出去,将是我衡量其成功与否的关键标准之一。

评分

坦白讲,我过去购买的一些技术书籍,最大的问题在于其语言风格过于生硬,读起来像是在啃一本技术规范手册,知识点分散,上下文衔接晦涩。我希望这本书能够采用一种更加平易近人、更具“导师”口吻的叙述方式。我追求的是一种渐进式的学习体验,即每引入一个新概念或新函数,都能有一个清晰的、易于理解的铺垫,并通过紧随其后的代码示例来加以巩固。如果作者能够在解释复杂统计模型时,恰当地穿插一些生活化的类比或直观的解释,那将极大地帮助我这类非科班出身的学习者建立直观理解。我对那些能够将学术严谨性与教学趣味性完美结合的书籍抱有最高的期望,希望这本书能在这方面表现出色,让学习过程不再是煎熬,而是一种持续发现和解决问题的乐趣。

评分

我最近在学习如何利用R语言处理和可视化真实世界的数据集,市面上的教材汗牛充栋,但大多要么过于侧重理论的堆砌,要么就是代码实例陈旧且缺乏实际操作性。这本书的目录结构给我留下了深刻的第一印象——它似乎非常注重“方法”与“案例”的平衡。我个人更倾向于通过解决实际问题来学习新技能,如果一本书只讲原理而不给出口,学起来会非常吃力。我注意到其中似乎包含了从数据清洗、探索性分析到高级模型构建的全流程,这表明它不是一本浅尝辄止的入门读物,而是意图深入地指导读者完成一个完整的数据项目。特别是那些标注为“案例详解”的部分,我非常好奇它们会选取哪些具有代表性的数据集,以及如何将抽象的统计概念转化为可以运行、可以验证的R代码。希望这本书能够真正弥补我目前在实战经验上的不足,让我能够自信地应对职场中的各种数据挑战。

评分

总算是算学了r 其中的很多推导过程都跳过去了 曾经试过去理解 但是感觉其中的很多符号都没有解释清楚是什么意思 但是也还是了解了各种分析方法的对象了

评分

非常不错的国内教材。案例丰富,解说清晰。

评分

一颗星给我的男神朱建平老师,另一颗星给辛苦翻译其他书的经院同学。

评分

总算是算学了r 其中的很多推导过程都跳过去了 曾经试过去理解 但是感觉其中的很多符号都没有解释清楚是什么意思 但是也还是了解了各种分析方法的对象了

评分

中规中矩,后半部分需要一些概率论基础,模型部分俺看不懂···

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2026 onlinetoolsland.com All Rights Reserved. 本本书屋 版权所有