山田浩之(作者)
信息工程學博士。先後於日本IBM、雅虎從事分布式搜索引擎的研發工作。目前在東京大學生産技術研究所從事高性能並行數據庫的研發工作。
末永匡(作者)
開源搜索引擎Senna/Groonga的開發者。每天都在奮鬥,夢想著能創建一個更加自由、更加無拘無束的,而不是一傢獨大的應用程序平颱。
鬍屹(譯者)
多年從事Web開發工作。熱愛編程,關注設計模式,緻力於提升軟件開發的質量。曾獲得SCJP和PHP ZCE證書。譯有《計算機是怎樣跑起來的》。
《自製搜索引擎》聚焦於Google和Yahoo!等Web搜索服務幕後的搜索引擎係統,首先講解瞭搜索引擎的基礎知識和原理,接著以現實中的開源搜索引擎Senna/Groonga為示例,使用該引擎的源代碼引導讀者親自體驗搜索引擎的開發過程。這部分講解涉及瞭倒排索引的製作和壓縮、檢索的處理流程以及搜索引擎的優化等內容。又簡單介紹瞭一些更加專業的搜索引擎的知識和要點,為讀者今後進一步學習打下瞭基礎。本書適閤所有對搜索引擎感興趣的技術人員閱讀。
發表於2024-06-02
自製搜索引擎 2024 pdf epub mobi 電子書 下載
1. 第一章“搜索引擎是如何工作的”是我感覺收獲最多的一部分,把倒排說明說得比較清楚,通過一些插圖能容易理解倒排索引對於搜索的核心作用; 2. 本書是通過C語言來實現一個小型的搜索引擎,代碼量比較少而且都比較清楚,對於實現一個搜索引擎的理解是很有幫助的; 3. 另外還...
評分1. 第一章“搜索引擎是如何工作的”是我感覺收獲最多的一部分,把倒排說明說得比較清楚,通過一些插圖能容易理解倒排索引對於搜索的核心作用; 2. 本書是通過C語言來實現一個小型的搜索引擎,代碼量比較少而且都比較清楚,對於實現一個搜索引擎的理解是很有幫助的; 3. 另外還...
評分1. 第一章“搜索引擎是如何工作的”是我感覺收獲最多的一部分,把倒排說明說得比較清楚,通過一些插圖能容易理解倒排索引對於搜索的核心作用; 2. 本書是通過C語言來實現一個小型的搜索引擎,代碼量比較少而且都比較清楚,對於實現一個搜索引擎的理解是很有幫助的; 3. 另外還...
評分在此之前還看過《這就是搜索引擎 : 核心技術詳解 》,以及翻閱過圖書館一兩本搜索相關教科書。 其他書,都是部分概念講得還行,但是極少有真正的代碼講解。 該書經典之處, 一是行文思路邏輯清晰,編排閤理。搜索原理、倒排索引核心與實現、檢索排序、搜索的優化,以及還有哪...
評分在此之前還看過《這就是搜索引擎 : 核心技術詳解 》,以及翻閱過圖書館一兩本搜索相關教科書。 其他書,都是部分概念講得還行,但是極少有真正的代碼講解。 該書經典之處, 一是行文思路邏輯清晰,編排閤理。搜索原理、倒排索引核心與實現、檢索排序、搜索的優化,以及還有哪...
圖書標籤: 搜索引擎 計算機 編程 Programming 軟件開發 計算機科學技術 IT search
概念講得清晰,但講的東西並不多。
評分瞭解搜索引擎中倒排索引的構建和查詢的實現的核心
評分榖歌的時代,早就該結束瞭。
評分非常好的一本書,翻譯也不錯,該書應算簡潔經典奇作瞭。有評論說沒有wiser安裝和詳細講解,那應該是看書不仔細,看網頁不仔細,基礎欠缺的原因。注意wiser的源碼是要在linux或者mac的機器上編譯運行的。
評分瞭解搜索引擎中倒排索引的構建和查詢的實現的核心
自製搜索引擎 2024 pdf epub mobi 電子書 下載