精通特徵工程 2025 pdf epub mobi 電子書 下載
☆☆☆☆☆
簡體網頁||
繁體網頁
精通特徵工程 pdf epub mobi 著者簡介
愛麗絲·鄭(Alice Zheng)
亞馬遜廣告平颱建模和優化團隊負責人,應用機器學習、生成算法和平颱開發領域的技術領導者,前微軟研究院機器學習研究員。
阿曼達·卡薩麗(Amanda Casari)
榖歌雲開發者關係工程經理,曾是Concur Labs的産品經理和數據科學傢,在數據科學、機器學習、復雜係統和機器人等多個領域都有豐富經驗。
精通特徵工程 pdf epub mobi 圖書描述
特徵工程是機器學習流程中至關重要的一個環節,然而專門討論這個話題的著作卻寥寥無幾。本書旨在填補這一空白,著重闡明特徵工程的基本原則,介紹大量特徵工程技術,教你從原始數據中提取齣正確的特徵並將其轉換為適閤機器學習模型的格式,從而輕鬆構建模型,增強機器學習算法的效果。
然而,本書並非單純地講述特徵工程的基本原則,而是通過大量示例和練習將重點放在瞭實際應用上。每一章都集中研究一個數據問題:如何錶示文本數據或圖像數據,如何為自動生成的特徵降低維度,何時以及如何對特徵進行標準化,等等。最後一章通過一個完整的例子演示瞭多種特徵工程技術的實際應用。書中所有代碼示例均是用Python編寫的,涉及NumPy、Pandas、scikit-learn和Matplotlib等程序包。
- 數值型數據的特徵工程:過濾、分箱、縮放、對數變換和指數變換
- 自然文本技術:詞袋、n元詞與短語檢測
- 基於頻率的過濾和特徵縮放
- 分類變量編碼技術:特徵散列化與分箱計數
- 使用主成分分析的基於模型的特徵工程
- 模型堆疊與k-均值特徵化
- 圖像特徵提取:人工提取與深度學習
精通特徵工程 2025 pdf epub mobi 電子書 下載
精通特徵工程 pdf epub mobi 圖書目錄
前言 ix
第1章 機器學習流程 1
1.1 數據 1
1.2 任務 1
1.3 模型 2
1.4 特徵 3
1.5 模型評價 3
第2章 簡單而又奇妙的數值 4
2.1 標量、嚮量和空間 5
2.2 處理計數 7
2.2.1 二值化 7
2.2.2 區間量化(分箱) 9
2.3 對數變換 13
2.3.1 對數變換實戰 16
2.3.2 指數變換:對數變換的推廣 19
2.4 特徵縮放/ 歸一化 24
2.4.1 min-max 縮放 24
2.4.2 特徵標準化/ 方差縮放 24
2.4.3 ℓ 2 歸一化 25
2.5 交互特徵 28
2.6 特徵選擇 30
2.7 小結 31
2.8 參考文獻 32
第3章 文本數據:扁平化、過濾和分塊 33
3.1 元素袋:將自然文本轉換為扁平嚮量 34
3.1.1 詞袋 34
3.1.2 n 元詞袋 37
3.2 使用過濾獲取清潔特徵 39
3.2.1 停用詞 39
3.2.2 基於頻率的過濾 40
3.2.3 詞乾提取 42
3.3 意義的單位:從單詞、n 元詞到短語 43
3.3.1 解析與分詞 43
3.3.2 通過搭配提取進行短語檢測 44
3.4 小結 50
3.5 參考文獻 51
第4章 特徵縮放的效果:從詞袋到tf-idf 52
4.1 tf-idf:詞袋的一種簡單擴展 52
4.2 tf-idf 方法測試 54
4.2.1 創建分類數據集 55
4.2.2 使用tf-idf 變換來縮放詞袋 56
4.2.3 使用邏輯迴歸進行分類 57
4.2.4 使用正則化對邏輯迴歸進行調優 58
4.3 深入研究:發生瞭什麼 62
4.4 小結 64
4.5 參考文獻 64
第5章 分類變量:自動化時代的數據計數 65
5.1 分類變量的編碼 66
5.1.1 one-hot 編碼 66
5.1.2 虛擬編碼 66
5.1.3 效果編碼 69
5.1.4 各種分類變量編碼的優缺點 70
5.2 處理大型分類變量 70
5.2.1 特徵散列化 71
5.2.2 分箱計數 73
5.3 小結 79
5.4 參考文獻 80
第6章 數據降維:使用PCA 擠壓數據 82
6.1 直觀理解 82
6.2 數學推導 84
6.2.1 綫性投影 84
6.2.2 方差和經驗方差 85
6.2.3 主成分:第一種錶示形式 86
6.2.4 主成分:矩陣- 嚮量錶示形式 86
6.2.5 主成分的通用解 86
6.2.6 特徵轉換 87
6.2.7 PCA 實現 87
6.3 PCA 實戰 88
6.4 白化與ZCA 89
6.5 PCA 的局限性與注意事項 90
6.6 用例 91
6.7 小結 93
6.8 參考文獻 93
第7章 非綫性特徵化與k-均值模型堆疊 94
7.1 k-均值聚類 95
7.2 使用聚類進行麯麵拼接 97
7.3 用於分類問題的k-均值特徵化 100
7.4 優點、缺點以及陷阱 105
7.5 小結 107
7.6 參考文獻 107
第8章 自動特徵生成:圖像特徵提取和深度學習 108
8.1 最簡單的圖像特徵(以及它們因何失效) 109
8.2 人工特徵提取:SIFT 和HOG 110
8.2.1 圖像梯度 110
8.2.2 梯度方嚮直方圖 113
8.2.3 SIFT 體係 116
8.3 通過深度神經網絡學習圖像特徵 117
8.3.1 全連接層 117
8.3.2 捲積層 118
8.3.3 ReLU 變換 122
8.3.4 響應歸一化層 123
8.3.5 池化層 124
8.3.6 AlexNet 的結構 124
8.4 小結 127
8.5 參考文獻 128
第9章 迴到特徵:建立學術論文推薦器 129
9.1 基於項目的協同過濾 129
9.2 第一關:數據導入、清理和特徵解析 130
9.3 第二關:更多特徵工程和更智能的模型 136
9.4 第三關:更多特徵= 更多信息 141
9.5 小結 144
9.6 參考文獻 144
附錄A 綫性建模與綫性代數基礎 145
A.1 綫性分類概述 145
A.2 矩陣的解析 147
A.2.1 從嚮量到子空間 148
A.2.2 奇異值分解(SVD) 150
A.2.3 數據矩陣的四個基本子空間 151
A.3 綫性係統求解 153
A.4 參考文獻 155
作者簡介 156
封麵簡介 156
· · · · · · (
收起)
下載链接在页面底部
點擊這裡下載
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
發表於2025-01-24
精通特徵工程 2025 pdf epub mobi 電子書 下載
精通特徵工程 2025 pdf epub mobi 電子書 下載
精通特徵工程 2025 pdf epub mobi 電子書 下載
喜欢 精通特徵工程 電子書 的读者还喜欢
精通特徵工程 pdf epub mobi 讀後感
評分
☆☆☆☆☆
在圖書館看到的,感覺內容很棒,來豆瓣mark一下,上班有錢後買一本。吐個槽,書有點薄,59元略貴。雖然知識無價,不過對比國內齣版物環境,嗯....相對有點點問題。 聲明一下,這本書不是入門書籍,不適閤機器學習入門/python入門的來看。 雖然英文名叫Feature Engineering for ...
評分
☆☆☆☆☆
我直言不諱,在我撰寫本文的時候,本書在豆瓣評分偏低。不忍好書濛塵,忍不住撰寫此文。 工程領域的書籍不好寫,實踐性太強。工程中要處理的問題總是一個例子一個例子組成的,一個項目一個項目實操乾齣來的,具體例子和具體例子之間差異非常之大,方法論難以提煉。判斷工程技術...
評分
☆☆☆☆☆
特徵工程是數據科學工程的核心,目前關於這個話題專門的書籍不多。本書通過概念(不是理論)和案例代碼相結閤的方式,還該瞭特徵工程中的一些基礎技術。包括分類型變量編碼,數值型數據的分箱,變換。文本處理,PCA以及基於模型的特徵工程。模型堆疊和k-均值特徵化。最後簡單介...
評分
☆☆☆☆☆
在圖書館看到的,感覺內容很棒,來豆瓣mark一下,上班有錢後買一本。吐個槽,書有點薄,59元略貴。雖然知識無價,不過對比國內齣版物環境,嗯....相對有點點問題。 聲明一下,這本書不是入門書籍,不適閤機器學習入門/python入門的來看。 雖然英文名叫Feature Engineering for ...
評分
☆☆☆☆☆
[https://github.com/apachecn/feature-engineering-for-ml-zh] ==========================================================================================================================================================
類似圖書 點擊查看全場最低價
出版者:人民郵電齣版社
作者:[美] 愛麗絲 • 鄭
出品人:
頁數:172
譯者:陳光欣
出版時間:2019-4
價格:59.00元
裝幀:平裝
isbn號碼:9787115509680
叢書系列:
圖書標籤:
機器學習
特徵工程
Python
大數據
數據科學
計算機
數據挖掘
數據分析與機器學習
精通特徵工程 2025 pdf epub mobi 電子書 下載
精通特徵工程 pdf epub mobi 用戶評價
評分
☆☆☆☆☆
因為特徵工程的書並不多,於是便入手瞭這本,我主要想看的是自然語言處理方麵對於特徵的處理。 看完之後很失望,講的東西非常的少,而且很多都是老舊,很普遍的內容。 作為一本工具書,它對我的幫助實在是不大。
評分
☆☆☆☆☆
一般的特徵工程都略知一二,這本書算是幫忙梳理瞭一邊,完善瞭細節的感覺
評分
☆☆☆☆☆
作為一個高數隻學過數理統計的人,這本書看得太特麼難受瞭,全是亂七八糟的名詞,同一個概念,上下句間還要換種叫法,可以說很裝逼瞭。給的代碼集跟書上寫的代碼不是一路的,目前還沒看齣是乾嘛用的。第二章歐式範數縮放的圖非常有誤導性且跟公式不搭配,當我們都已經會瞭嗎?mix-max縮放的公式減號還丟瞭,差評。
評分
☆☆☆☆☆
要吃透這本書的內容的前提是對綫性代數的熟練掌握,因為這裏麵涉及到大量術語,雖然有講解但還是很粗略。給齣的代碼很簡潔實用,內容安排也比較閤理。
評分
☆☆☆☆☆
要吃透這本書的內容的前提是對綫性代數的熟練掌握,因為這裏麵涉及到大量術語,雖然有講解但還是很粗略。給齣的代碼很簡潔實用,內容安排也比較閤理。
精通特徵工程 2025 pdf epub mobi 電子書 下載