開發自己的搜索引擎--Lucene 2.0+Heriterx pdf epub mobi txt 電子書下載2025

簡體網頁||繁體網頁

☆☆☆☆☆

出版者:人民郵電齣版社

作者:邱哲

出品人:

頁數:521 页

译者:

出版時間:2007年6月1日

價格:65.00元

裝幀:平裝

isbn號碼:9787115160003

叢書系列:

圖書標籤:

搜索引擎
Lucene
Heritrix
開發自己的搜索引擎——Lucene
SearchEngine
搜索
search
收索引擎

下載連結在頁面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 複製連結

想要找書就要到本本書屋

onlinetoolsland.com

立刻按 ctrl+D收藏本頁

你會得到大驚喜!!

《開發自己的搜索引擎:Lucene 2.0+Heritrix》參加人郵社買書送禮活動,數量有限趕快搶購!詳情請點擊

　　第一本講解如何使用Lucene和Heritrix來構建搜索引擎的書

　　一步一步帶領您親手構建企業級搜索引擎網站

　　國內資深搜索引擎開發專傢車東推薦

　　配有一個完整的搜索引擎案例。這個案例有很強的實用價值，隻需稍加修改，就能應用於實際項目，市場價值在30000元以上！

　　Google技術經理車東推薦

　　國內第一本詳細介紹搜索引擎開發過程的圖書

　　采用最新的Lucene 2.0

　　互聯網搜索的使用水平可以反映全民的信息處理能力，幾年前有研究發現美國用戶比歐洲用戶的互聯網使用水平領先半年左右，主要是根據誰搜索時平均使用的關鍵詞的個數多。中文用戶的搜索使用水平相對於西文用戶目前仍然處於比較初級的階段，而中文網站搜索功能的缺失也是一個重要的因素。

網站擁有瞭較多內容後，最先會考慮基於目錄的內容分類，以解決信息快速定位的問題，隨著內容量的進一步增加，很多內容在發錶之後就很快被湮沒，成為“信息孤島”，而不斷加深的目錄結構也會讓用戶逐漸失去耐心，這時，關鍵詞檢索的優勢就體現齣來瞭：

關鍵詞檢索可以讓處於“信息孤島”狀態的內容以一種更直接的方法提供給用戶；

和基於目錄/分類的樹形結構不同，基於關鍵詞檢索還可以讓內容之間實現網狀的關聯結構，從而大大提高信息的引用密度。

基於傳統數據庫的關鍵詞檢索由於性能問題讓很多網站放棄瞭搜索功能，問題的解決歸根結底還是需要一個全文引擎。而Lucene開源引擎的齣現讓這種原來被少數公司掌握的技術得到瞭迅速的普及，這裏應該再次感謝引擎的核心貢獻者Doug Cutting先生，同時也希望有更多的中文開發人員能積極投入到Lucene的相關項目開發中去，尤其在中文和其他亞洲雙字節語言處理方麵的問題。

Lucene也是我學習的第一個Java程序，當初是通過jdb一行行dubug瞭解其中的原理和機製的，非常高興有這樣一本專門的參考書齣現，它無疑會為開發人員瞭解並更快掌握全文檢索技術節省大量的時間。

國內資深搜索引擎開發專傢車東

　　《開發自己的搜索引擎:Lucene 2.0+Heritrix》詳細介紹瞭如何應用Lucene進行搜索引擎開發，通過學習《開發自己的搜索引擎:Lucene 2.0+Heritrix》，讀者可以完成構建一個企業級的搜索引擎網站。

　　《開發自己的搜索引擎:Lucene 2.0+Heritrix》是國內第一本使用Lucene和Heritrix來講解搜索引擎構建的書，通過詳細的對API和源代碼的分析，力求使讀者在應用的基礎上，能夠深入其核心，自行擴展和開發相應組件，發揮想象力，開發齣更具有創意的搜索引擎産品。《開發自己的搜索引擎:Lucene 2.0+Heritrix》適閤Java程序員和從事計算機軟件開發的其他編程人員閱讀，同時也可以作為搜索引擎愛好者的入門書籍。

　　由於目前市麵上從技術層麵介紹搜索引擎的書並不多，即使有，也大多停留在理論階段，而非搜索引擎的開發過程。因此，可以說《開發自己的搜索引擎:Lucene 2.0+Heritrix》是國內第一本詳細介紹搜索引擎開發過程的圖書。

　　（1）采用最新的Lucene 2.0。以前大傢用的1.4.3版本，而最新的Lucene 2.0重寫瞭很多API，內部的實現方法也有瞭很大優化。《開發自己的搜索引擎:Lucene 2.0+Heritrix》的代碼都是在2.0版本下調試通過的，這樣可以幫助讀者瞭解Lucene的更多新功能。

　　（2）配有一個完整的搜索引擎案例。這個案例有很強的實用價值，隻需稍加修改，就能應用於實際項目，市場價值在30000元以上！

　　（3）著重解決開發人員頭痛的問題。《開發自己的搜索引擎:Lucene 2.0+Heritrix》的目的是指導項目實踐，因此沒有羅列各個API的用法，而是對常見的開發問題進行深入探討，比如《開發自己的搜索引擎:Lucene 2.0+Heritrix》的第7章，是專門為解決“Word，Excel和PDF文件如何解析”這個問題而設置的。

　　（4）內容新穎，前衛實用。《開發自己的搜索引擎:Lucene 2.0+Heritrix》介紹瞭Compass、Heritrix、DWR和HTMLParser等內容。在搜索引擎開發的過程中，這些均為相當重要且實用的技術，筆者經過自身實踐將它們展現給讀者，希望能讓讀者在學習Lucene的同時開拓視野。

具體描述

讀後感

評分☆☆☆☆☆

這本書還是不錯的，通過一個豐富的例子，把Lucene，Heritrix,HTMLParser幾種技術結閤起來。讓人可以通過這本書舉一反三，做齣類似的項目。

評分☆☆☆☆☆

我基本上看過瞭這本書，其中代碼部分講解比較詳細，但是第八章不太詳細！另:我買這本書的時候，缺瞭幾頁現在無法更換，如有讀者也在讀這本書，真心請求給予幫助，我少的頁碼是400，401，404，405，412，413！如能給給予提供，萬分感謝。 email： feiniao0401@yahoo.com.cn QQ:...

評分☆☆☆☆☆

或者是因為期望比較高，所以失望比較大。這本書對Lucene和Heritrix，HTMLParser等等開源工具做瞭一些介紹，並不怎麼深入。而且實際沒有完整地給齣一個搜索引擎的框架。雖然有一個可以進行搜索的例子，但是離一個可用的搜索引擎還是比較遠的。例如我想一個搜索引擎最少內部...

評分☆☆☆☆☆

在進大學前就看到過這本書，當時雖然不懂多少代碼，但是它堅定瞭我進計算機係的選擇。大三的時候要用Lucene而真正開始用這本書，感覺就像是老朋友一樣，十分迅速的學會瞭Lucene。它不但教怎麼用Lucene，還會教其原理，例如一個細節：Lecene的TF是要開根號的。這個細節使得我的...