作者簡介
Martin Kleppmann是英國劍橋大學分布式係統方嚮的研究員。此前,他曾是LinkedIn和Rapportive等互聯網公司的軟件工程師,負責大規模數據基礎設施建設。在此過程中他遇到過一些睏難,因此他希望這本書能夠幫助讀者避免重蹈覆轍。Martin還是一位活躍的會議演講者、博主和開源貢獻者。他認為,每個人都應該學習深刻的技術理念,對技術的深入理解能幫助我們開發齣更好的軟件。
譯者簡介
趙軍平, 大數據存儲與分析資深開發者與推廣者(EMC 10餘年),GPU異構計算的親曆者。中國計算機協會專傢委員,DELL EMC資深架構師。12年係統研發、創新與團隊管理經驗,擅長數據存儲與保護, 雲計算與大數據實時分析,GPU異構加速優化等。相關領域已申請中、美技術專利100餘項,並多次在SNIA,LinuxConf,Hadoop Summit, Nvidia GPU Tech Conf等做技術分享,持續關注數據密集和計算密集相關技術的演進、融閤與賦能推廣。
呂雲鬆,北京大學計算機碩士,碩士及DELL EMC中國研究院實習期間專注於大數據實時流式處理相關的研究。現就職於華為2012中軟院黎曼實驗室,主要從事深度學習的研發。
耿煜,DELL EMC架構師兼GTM負責人,緻力於推廣企業級數字化轉型方案。深耕分布式架構以及雲計算12年,先後任職於ChinaCache,Sun Microsystems以及EMC等公司。
李三平,美國麻省大學計算機工程專業博士,DELL EMC中國研究院首席科學傢,研究方嚮為機器學習、深度學習、智能運維、遙感影像等。已在IEEE Transactions期刊和會議上發錶論文數十篇,申請美國專利20餘項。推崇簡約,熱衷機器學習。
全書分為三大部分:
第一部分,主要討論有關增強數據密集型應用係統所需的若乾基本原則。首先開篇第1章即瞄準目標:可靠性、可擴展性與可維護性,如何認識這些問題以及如何達成目標。第2章我們比較瞭多種不同的數據模型和查詢語言,討論各自的適用場景。接下來第3章主要針對存儲引擎,即數據庫是如何安排磁盤結構從而提高檢索效率。第4章轉嚮數據編碼(序列化)方麵,包括常見模式的演化曆程。
第二部分,我們將從單機的數據存儲轉嚮跨機器的分布式係統,這是擴展性的重要一步,但隨之而來的是各種挑戰。所以將依次討論數據遠程復製(第5章)、數據分區(第6章)以及事務(第7章)。接下來的第8章包括分布式係統的更多細節,以及分布式環境如何達成一緻性與共識(第9章)。
第三部分,主要針對産生派生數據的係統,所謂派生數據主要指在異構係統中,如果無法用一個數據源來解決所有問題,那麼一種自然的方式就是集成多個不同的數據庫、緩存模塊以及索引模塊等。首先第10章以批處理開始來處理派生數據,緊接著第11章采用流式處理。第12章總結之前介紹的多種技術,並分析討論未來構建可靠、可擴展和可維護應用係統可能的新方嚮或方法。
發表於2025-03-11
數據密集型應用係統設計 2025 pdf epub mobi 電子書 下載
摘要,後麵再讀補總結。字數還說不能少於140 字[捂臉哭]簡直瞭。 書中比較詳細描述瞭數據庫,從數據庫衍生派生數據,批處理,流處理等衍生。主要是問題-思路-問題的方式,但其問題角度考慮極端,分布式也正是這些極端場景的發源地。對自己是一個比較全麵的分布式認知,對於很多...
評分1.數據模型 從數據庫的數據模型上,可以將數據庫分為關係型、文檔型以及圖型數據庫等。這三類數據庫在形式和使用的場景上各有不同。 1.1.關係型 關係型模型基於集閤論中的關係理論,將數據視為Tuple的集閤。關係型在1970年被提齣,人們一開始質疑這類技術是否能高效地實現,但...
評分 評分1.數據模型 從數據庫的數據模型上,可以將數據庫分為關係型、文檔型以及圖型數據庫等。這三類數據庫在形式和使用的場景上各有不同。 1.1.關係型 關係型模型基於集閤論中的關係理論,將數據視為Tuple的集閤。關係型在1970年被提齣,人們一開始質疑這類技術是否能高效地實現,但...
評分Data is at the center of many challenges in system design today. Difficult issues need to be figured out, such as scalability, consistency, reliability, efficiency, and maintainability. In addition, we have an overwhelming variety of tools, including relati...
圖書標籤: 分布式係統 計算機 分布式 數據庫 架構 計算機科學 數據 大數據
為瞭您的身體健康,請不要閱讀開源翻譯版本....我隻舉一個例子。leader one翻譯成林登萬是幾個意思?難不成還有林登兔?
評分為瞭您的身體健康,請不要閱讀開源翻譯版本....我隻舉一個例子。leader one翻譯成林登萬是幾個意思?難不成還有林登兔?
評分書是好書,但是對我有點超綱瞭,有幾章雲裏霧裏;吐槽第三部分很多錯彆字、翻譯不通順;當做是第一遍通讀一下。
評分上帝視角細數各類數據相關係統優劣得失,用學術研究的方式來寫書,本質上就是一本大綜述,真是太適閤我瞭,太棒瞭。信息量超大,將我平時瞭解的各種零散概念關聯串結起來,感覺任督二脈已打通,要飄瞭
評分為瞭您的身體健康,請不要閱讀開源翻譯版本....我隻舉一個例子。leader one翻譯成林登萬是幾個意思?難不成還有林登兔?
數據密集型應用係統設計 2025 pdf epub mobi 電子書 下載