Andrew R. Webb和Keith D. Copsey目前任職於英國Malvern的Mathematics and Data Analysis Consultancy公司,是機器學習方嚮的著名專傢。
譯 者 序
信息時代,無處不有模式識彆的需求。概括地講,模式識彆是一門以應用數學為理論基礎,利用計算機應用技術,解決實際分類及識彆問題的學問。按照研究問題的特點及解決問題的手段特徵,通常有統計模式識彆和結構模式識彆之分,前者以多元統計理論為數學基礎,以數據特徵的形式對問題進行描述,而後者則以形式語言為數學基礎,以結構圖元的形式對問題進行描述,它們都緻力於將隱含在大量樣本中的類間差異的規律歸納齣來,並綜閤成適當的分類、識彆乃至預測模型。
從發展的角度看,在傳統的、較成熟的分類和識彆方法的基礎上,模糊數學思想方法的介入,人工神經網絡對統計模型類型的豐富、進化算法等一批優秀算法的齣現,支持嚮量機、復雜網絡、極度學習和深度學習等一些新方法的提齣和介入等,使統計模式識彆的研究和應用充滿活力。
英國著名學者Andrew R. Webb所著《統計模式識彆》一書對統計模式識彆的理論、概念和方法進行瞭全麵介紹,並在以下方麵具有鮮明特點。
1.編寫體係。本書以“分類與識彆”為主綫,在“基本概念理論分析方法講解應用實例拓展研究”的框架下,介紹統計模式識彆的每一個具體方法; 再以應用研究、建議、參考文獻等,對由若乾方法形成的一類問題進行綜述。其中,“拓展研究”能夠使讀者從知識點伸展到麵,進一步瞭解相關問題的研究動態及人們普遍關注的問題; 而“應用研究”則將模式識彆技術與廣泛的實際問題緊密相聯,頗具啓迪性; “總結”及“建議”凝結瞭作者的體會和經驗,頗具指導性; “參考文獻”給齣瞭所列文獻與書中內容的聯係及其特色。這樣的組織格局使讀者從局部到全局、從理論到方法、從方法到應用、從研究動態到問題展望,一覽無餘。
2.清晰的分類方法的主綫設計。作者將各種分類器學習方法收納於統計決策、超特徵空間劃分這兩條主綫中,從第2章到第9章,用瞭共八章的篇幅。統計決策重點解決類概率密度函數的訓練,除瞭非參數法和參數法之外,增加瞭貝葉斯方法的介紹,特彆是按照近鄰法直方圖法核函數法級數法逐步展開的概率密度估計的講解,對學習者理解、掌握和用好相關技術大有益處; 超特徵空間劃分按照綫性和非綫性綫條展開,自然引齣對支持嚮量機和多層感知器的介紹,規則歸納法反映瞭模式識彆與智能方法的有機聯係,搭建起從分類模型的判彆分析到可解釋規則的橋梁。
3.將最新研究方法融入統計模式識彆框架。作者在“分類與識彆”主綫下帶齣對統計模式識彆概念、新方法(例如人工神經網、模糊思想用於聚類、支持嚮量機、新的非參數方法、譜聚類、復雜網絡等)的較詳盡介紹,使讀者能夠更深層次地理解它們的構成內涵及其識彆行為屬性,從而為根據具體問題特點靈活、閤理地選用它們提供幫助。
4.內容前後呼應。作者在保持各章節內容相對獨立的前提下,特彆加強瞭“談此及彼”,使讀者能夠對一種重要方法進行多角度的理解和消化。
5.辯證評述和比較性研究。模式識彆問題本身決定瞭目前實用的模式識彆方法和技術沒有絕對的好與壞。相信讀者會從本書的字裏行間領略到作者科學嚴謹的理論分析及辯證客觀的方法評述,並從中受益。另外,本書特彆強調並略加筆墨的“分類器優化組閤”、“比較性研究”,近年來受到模式識彆學者和專傢的重視,值得讀者關注。
本書對上一版的大部分章節內容都進行瞭重新編寫和組織,包括內容順序的梳理和調整,使其內容的模塊性更強,分類方法的綫條更清晰,與機器學習、數據挖掘及知識發現的關聯更緊密; 配置瞭更多的例子和圖錶,使內容更易讀、易理解。
本書的中譯本在上版譯稿基礎上完成。上一版翻譯工作由王萍、楊培龍和羅穎昕完成。在這個版本的翻譯過程中,範凱波、王娟、王迪、閆春遐和杜雪峰等,在新增內容初譯和公式整理等方麵提供瞭幫助。全書由王萍統稿和定稿。
在這裏嚮為本書的翻譯工作做齣貢獻的所有人錶示感謝,包括已經畢業的學生楊培龍、羅穎昕和杜雪峰,以及即將畢業的博士生王娟和碩士生閆春遐,在讀的博士生範凱波、王迪和石君誌。謝謝你們!
由於譯者水平所限,譯文中難免有疏漏和不妥之處,懇請讀者不吝賜教。
王 萍
2014年9月
於天津大學
本書介紹統計模式識彆的基本理論和技術,其中大部分內容涉及識彆和分類問題,並取材於工程學、統計學、計算機科學和社會學等領域的相關文獻。在這些文獻中,反映瞭許多當今最有用的模式處理技術,包括許多最新的非參數識彆方法和貝葉斯計算方法,本書一並對它們進行介紹,並對使用這些技術方法的起因和支撐這些技術方法的理論展開討論,以使讀者在使用那些流行軟件包解決問題時獲益最大。本書對各項技術均附以應用研究實例說明之。至於書中涉及的模式識彆的應用、對比研究法及理論進展的細節,可以在書後各類文獻中找到。
本書內容源自我們對統計模式識彆方法進展的研究,以及對傳感器數據分析問題的實際應用,針對高年級本科生課程和研究生課程而寫,其中有些材料已用於研究生的模式識彆課程及模式識彆暑期班。本書也是為模式識彆領域的實際工作者及其研究者所設計的。作為學習本書內容的先決條件,學習者應具備概率論和綫性代數的基本知識,掌握一些基本數學方法(例如,在一些推導中,用於解決具有等式約束和不等式約束問題的拉格朗日數乘法)。本書前版附錄提供的一些基本材料可以在本書配套網站找到。
範圍
本書展現絕大多數常用的統計模式識彆方法。然而,模式識彆的許多重要研究進展並非局限於統計學文獻,而經常呈現於與機器學習交叉的研究領域。因此,打破傳統的統計模式識彆的框架將是有益的,本書正是這樣做的。例如,我們把一些規則歸納方法作為一種補充方法添加進來,以通過決策樹歸納掌控探索過程。本書談到的大多數方法具有一般性,即這些方法並不要求指定數據或應用的特定類型,於是本書內容不涉及大傢時常用到的信號(和圖像)預處理方法,以及信號(和圖像)濾波方法。
方法
本書每一章所討論的方法,均會安排講述與其相關的基本概念和算法,均會在章末給齣引自參考文獻的相關方法或分類技術的實際應用,其主要目是理解方法的基本概念。有時候需要進行一些詳細的數學描述,因此有時不得不劃一個界限,以掌控把哪個特定主題討論到多深。本書涉及的大部分主題可以用整本書來論述,於是我們不得不對所擁有的材料進行取捨,因此每一章的最後一節均提供瞭主要的參考文獻。章末所附習題與開捲式問題有所不同,開捲式問題涉及比較冗長的計算機工程項目。
第三版的新增內容
本書對前版的許多章節進行瞭重新編寫,並添加瞭一些新的材料,新增內容特點如下。 第3章的內容是新增的,這一章講述密度估計的貝葉斯法,包括對貝葉斯采樣方案的內容拓展、馬爾可夫鏈濛特卡羅方法、序貫濛特卡羅采樣器和變分貝葉斯法。
新增一節專門講述密度估計的非參數方法。
新增規則歸納方法。
為分類器的組閤方法新增一章。
對特徵選擇內容進行瞭重新修訂,增添瞭關於特徵選擇穩定性的章節。
新增譜聚類內容。
新增一章講述復雜網絡問題,這個問題與社會及計算機網絡分析的高增長領域相關。
全書梗概
第1章作為統計模式識彆的緒論,給齣一些名詞術語的定義,介紹監督型分類和無監督型分類。就監督型分類而言,有兩種研究方法: 一種方法基於概率密度函數的運用; 另一種方法則基於判彆函數的構建。在這一章的最後對模式識彆的完整過程進行概括,細節問題則安排在後續章節中討論。第2章至第4章討論識彆問題的密度函數法。其中,第2章講解密度函數估計的參數法,它們在貝葉斯法上的進一步拓展安排在第3章,第4章討論非參數分類器的實現方案,包括被廣泛使用的k近鄰法及與之相關的有效搜索算法。
第5章至第7章研究有監督分類問題的判彆函數的構建方法。第5章集中討論綫性判彆函數,其中所涉及的大多數判彆法(包括優化、正則化和支持嚮量機)也適用於第6章展開的非綫性研究。第6章探討基於核函數的方法,特彆是徑嚮基函數網絡和支持嚮量機,還討論瞭基於投影的方法(多層感知器),這些通常稱為神經網絡方法。第7章討論如何使分類函數變為可解釋的規則,這種判彆方法對一些應用來說非常重要。
第8章討論分類器的集成方法,即為提高係統的魯棒性,將多個分類器組閤起來。第9章講述如何測評分類器的性能。
第10章和第11章探討數據分析和預處理技術(這些工作通常先於第5章至第7章介紹的有監督分類工作,盡管有時可以用來作為有監督方法的後置處理)。第10章講述特徵選擇和特徵提取方法,它們用以降低描述原始數據特徵的維數,這項工作通常是分類器整體設計工作的一部分,隻是被人為地將這一模式識彆問題劃分為相對獨立的特徵提取過程和模式分類過程。特徵提取可以幫助我們深入瞭解數據結構及分類器需要選用的類型,因此該研究備受關注。第11章講述無監督分類或稱聚類問題,即在樣本群中找到所存在的結構並藉此將其分組的過程。這類技術的工程應用是對圖像進行矢量量化及對語音編碼。第12章討論復雜網絡問題,所述方法對待分析的數據用圖形的數學概念進行錶述,所述及問題與社會及計算機網絡的關聯很顯著。
最後,即第13章,討論一些重要的包括模型選擇問題在內的研究課題。
本書網站
對如下問題提供瞭補充材料: 相異測度、估計方法、綫性代數、數據分析和基本概率方法。
緻謝
在編寫本書第三版的過程中,我們得到瞭很多人的幫助。在此特彆感謝East Anglia大學的Gavin Cawley博士所給予的幫助和建議,感謝朋友們和同事們(RSRE,DERA 和 QinetiQ的自始至終的幫助),他們對原稿的不同部分提齣瞭許多寶貴意見。還要特彆感謝Anna Skeoch為第12章提供數據; 感謝Richard Davies和John Wiley的同事們為稿件的最終齣版所給予的幫助。Andrew Webb特彆感謝Rosemary所給予的愛、支持和耐心。
發表於2024-12-22
統計模式識彆 2024 pdf epub mobi 電子書 下載
圖書標籤: 模式識彆 機器學習 統計學 算法 數學 人工智能 統計學習
沒見過翻譯這麼差的書,確實是頭一本看瞭一小會就看不下去的
評分沒見過翻譯這麼差的書,確實是頭一本看瞭一小會就看不下去的
評分沒見過翻譯這麼差的書,確實是頭一本看瞭一小會就看不下去的
評分2016給自己的禮物。剛開始看,先不做詳細的評價,當然,希望找到誌同道閤的學伴。
評分沒見過翻譯這麼差的書,確實是頭一本看瞭一小會就看不下去的
統計模式識彆 2024 pdf epub mobi 電子書 下載