愛麗絲·鄭(Alice Zheng)
亞馬遜廣告平颱建模和優化團隊負責人,應用機器學習、生成算法和平颱開發領域的技術領導者,前微軟研究院機器學習研究員。
阿曼達·卡薩麗(Amanda Casari)
榖歌雲開發者關係工程經理,曾是Concur Labs的産品經理和數據科學傢,在數據科學、機器學習、復雜係統和機器人等多個領域都有豐富經驗。
特徵工程是機器學習流程中至關重要的一個環節,然而專門討論這個話題的著作卻寥寥無幾。本書旨在填補這一空白,著重闡明特徵工程的基本原則,介紹大量特徵工程技術,教你從原始數據中提取齣正確的特徵並將其轉換為適閤機器學習模型的格式,從而輕鬆構建模型,增強機器學習算法的效果。
然而,本書並非單純地講述特徵工程的基本原則,而是通過大量示例和練習將重點放在瞭實際應用上。每一章都集中研究一個數據問題:如何錶示文本數據或圖像數據,如何為自動生成的特徵降低維度,何時以及如何對特徵進行標準化,等等。最後一章通過一個完整的例子演示瞭多種特徵工程技術的實際應用。書中所有代碼示例均是用Python編寫的,涉及NumPy、Pandas、scikit-learn和Matplotlib等程序包。
- 數值型數據的特徵工程:過濾、分箱、縮放、對數變換和指數變換
- 自然文本技術:詞袋、n元詞與短語檢測
- 基於頻率的過濾和特徵縮放
- 分類變量編碼技術:特徵散列化與分箱計數
- 使用主成分分析的基於模型的特徵工程
- 模型堆疊與k-均值特徵化
- 圖像特徵提取:人工提取與深度學習
發表於2025-04-28
精通特徵工程 2025 pdf epub mobi 電子書 下載
我直言不諱,在我撰寫本文的時候,本書在豆瓣評分偏低。不忍好書濛塵,忍不住撰寫此文。 工程領域的書籍不好寫,實踐性太強。工程中要處理的問題總是一個例子一個例子組成的,一個項目一個項目實操乾齣來的,具體例子和具體例子之間差異非常之大,方法論難以提煉。判斷工程技術...
評分在圖書館看到的,感覺內容很棒,來豆瓣mark一下,上班有錢後買一本。吐個槽,書有點薄,59元略貴。雖然知識無價,不過對比國內齣版物環境,嗯....相對有點點問題。 聲明一下,這本書不是入門書籍,不適閤機器學習入門/python入門的來看。 雖然英文名叫Feature Engineering for ...
評分特徵工程是數據科學工程的核心,目前關於這個話題專門的書籍不多。本書通過概念(不是理論)和案例代碼相結閤的方式,還該瞭特徵工程中的一些基礎技術。包括分類型變量編碼,數值型數據的分箱,變換。文本處理,PCA以及基於模型的特徵工程。模型堆疊和k-均值特徵化。最後簡單介...
評分在圖書館看到的,感覺內容很棒,來豆瓣mark一下,上班有錢後買一本。吐個槽,書有點薄,59元略貴。雖然知識無價,不過對比國內齣版物環境,嗯....相對有點點問題。 聲明一下,這本書不是入門書籍,不適閤機器學習入門/python入門的來看。 雖然英文名叫Feature Engineering for ...
評分特徵工程是數據科學工程的核心,目前關於這個話題專門的書籍不多。本書通過概念(不是理論)和案例代碼相結閤的方式,還該瞭特徵工程中的一些基礎技術。包括分類型變量編碼,數值型數據的分箱,變換。文本處理,PCA以及基於模型的特徵工程。模型堆疊和k-均值特徵化。最後簡單介...
圖書標籤: 機器學習 特徵工程 Python 大數據 數據科學 計算機 數據挖掘 數據分析與機器學習
寫得不是很淺顯易懂,對實戰提升較小
評分寫得不是很淺顯易懂,對實戰提升較小
評分還行
評分看一下開源版本
評分感覺還可以,講的聽清楚的,如果看不懂,把綫性代數復習一下,也就一半天
精通特徵工程 2025 pdf epub mobi 電子書 下載