譯者序
前言
緻謝
第1章引言
參考文獻
第2章處理信息與認識數據
2.1例1:2006年齣生數據
2.2例2:校友捐贈
2.3例3:橘子汁
參考文獻
第3章標準綫性迴歸
3.1用R函數估算綫性迴歸模型
3.2例1:汽車燃油效率
3.3例2:豐田二手車價格
附錄3.A模型過度擬閤對迴歸預測均方誤差的影響
參考文獻
第4章局部多項式迴歸的非參數迴歸方法
4.1模型的選擇
4.2密度估計和直方圖平滑化的應用
4.3多重迴歸模型的拓展
4.4例題和軟件
4.4.1例1:老忠實噴泉
4.4.2例2:NOx排放物
參考文獻
第5章簡約在統計建模中的重要性
5.1怎樣防止低假陽率
參考文獻
第6章多參數迴歸模型中基於懲罰算法的變量選擇
6.1例1:前列腺癌
6.2例2:橙汁
參考文獻
第7章Logistic迴歸
7.1對二分類響應數據建立綫性模型
7.2Logistic迴歸模型中迴歸係數的解釋
7.3統計推斷
7.4對新樣例的分類
7.5用R語言估計
7.6例1:死刑數據
7.6.1二分類Logistic迴歸:Minitab程序輸齣
7.6.2R語言輸齣結果的解釋與分析
7.7例2:延誤的航班
7.8例3:貸款驗收
7.9例4:德國信貸數據
參考文獻
第8章二元分類、概率和分類性能的評價
8.1二元分類
8.2使用概率作決策
8.3靈敏度和特異度
8.4例子:德國信貸數據
第9章最近鄰分析分類
9.1k近鄰算法
9.2例1:玻璃碎片的法醫分析
9.3例2:德國信貸數據
參考文獻
第10章樸素貝葉斯分析:一種由以分類為主的變量對分類響應變量預測的模型
10.1例:航班延誤
參考文獻
第11章多項式Logistic迴歸
11.1計算軟件
11.2例1:玻璃碎片的法醫分析
11.3例2:重溫玻璃碎片的法醫分析
附錄11.A簡單三重矩陣的詳述
參考文獻
第12章分類和判彆分析的深入探討
12.1Fisher綫性判彆函數
12.2例1:德國信用卡數據
12.3例2:Fisher鳶尾花數據
12.4例3:玻璃碎片的法醫分析數據
12.5例4:MBA申請數據
參考文獻
第13章決策樹
13.1例1:前列腺癌
13.2例2:摩托車加速度
13.3例3:迴顧Fisher鳶尾花數據集
第14章迴歸、分類樹、計算軟件及其他實用分類方法的深入探討
14.1有關樹結構的R程序包
14.2卡方自動交互檢驗
14.3集成方法:Bagging算法、Boosting算法和隨機森林
14.4支持嚮量機
14.5神經網絡
14.6R程序包:關於數據挖掘的一個有用的圖形用戶界麵
參考文獻
第15章聚類
15.1k均值聚類
15.2另眼看聚類:將期望最大化算法應用於混閤正態分布
15.2.1E步
15.2.2M步
15.3層次聚類過程
參考文獻
第16章購物籃分析:關聯規則和提升度
16.1例1:在綫廣播
16.2例2:收入預測
參考文獻
第17章降維:因子模型和主成分分析
17.1例1:歐洲蛋白質的攝入數據
17.2例2:月度失業率數據
第18章帶多重共綫性輸入的降維迴歸:主成分迴歸和偏最小二乘法
18.1三個例子
18.1.1例1:模擬數據
18.1.2例2:基於50個州的曆史失業率預測某州下個月的失業率
18.1.3例3:預測下月失業率:比較不同方法樣本外預測效果
參考文獻
第19章文本數據:文本挖掘和情感分析
19.1逆多項式Logistic迴歸
19.2例1:餐館評論
19.3例2:政治主張
附錄19.AGentzkow/Shapiro關於“slant”的估計和偏最小二乘的關係
參考文獻
第20章網絡數據
20.1例1:15世紀佛羅倫薩的婚姻與權力
20.2例2:友誼網絡的連接
參考文獻
附錄A練習
附錄B參考文獻
· · · · · · (
收起)