发表于2024-11-02
Lucene+nutch搜索引擎开发 2024 pdf epub mobi 电子书
买了这本书,直接看这几天一直困惑自己的中文分词~~ 前面介绍了一大段中文分词的基本概要,和lucene的分析器 后面nutch的分析器只是简单的介绍了几个类,nutch中文分词只用了200字左右。 书中也没用很系统的介绍nutch如何实现中文分词,~~后面的案例也只是简单的单字切分。 ...
评分买了有段时间了,最近刚读完,觉得还好吧,挺系统的。 没有具体调试过上面的代码,不过看书主要看原理,代码也不那么重要。
评分最近做的东西有相关nutch和lucene的内容,其实这本书貌似nutch的东西没有讲很多,版本也比较老了,还不如直接网上搜索来的快,lucene倒是讲了很多,不过基本都是api的介绍,可能这样看起来比直接看文档舒服点。 原理的方面也是基本的介绍了下,说的不多也不太深入。 感觉如果要...
评分买了这本书,直接看这几天一直困惑自己的中文分词~~ 前面介绍了一大段中文分词的基本概要,和lucene的分析器 后面nutch的分析器只是简单的介绍了几个类,nutch中文分词只用了200字左右。 书中也没用很系统的介绍nutch如何实现中文分词,~~后面的案例也只是简单的单字切分。 ...
评分买了这本书,直接看这几天一直困惑自己的中文分词~~ 前面介绍了一大段中文分词的基本概要,和lucene的分析器 后面nutch的分析器只是简单的介绍了几个类,nutch中文分词只用了200字左右。 书中也没用很系统的介绍nutch如何实现中文分词,~~后面的案例也只是简单的单字切分。 ...
图书标签: 搜索引擎 lucene nutch 编程 搜索引擎开发 搜索 技术 计算机
《Lucene+nutch搜索引擎开发》以Lucene构建搜索引擎的开发过程为主线,由浅入深,循序渐进,为读者展示如何使用Lucene开发自己的搜索引擎系统。全书内容包括搜索引擎概述和原理、Lucene部署安装、Nutch网络蜘蛛与数据获取、Lucene索引建立、Lucene检索与查询、搜索结果排序、文档分析器与中文分词、格式化文本分析、分布式搜索与缓存等。为便于读者理解搜索引擎快速开发过程,《Lucene+nutch搜索引擎开发》最后几章进行了应用实例的讲解,包括Nutch构建专题搜索、Lucene构建企业级搜索实例以及相关的整体工程性能测试。
倒排索引结构,boolean模型,向量模型。
评分读研时从图书馆借来粗粗翻过,建议还不如直接看官网的帮助文档更有用。
评分讲的比较系统,但附带的代码有点问题
评分倒排索引结构,boolean模型,向量模型。
评分讲的比较系统,但附带的代码有点问题
Lucene+nutch搜索引擎开发 2024 pdf epub mobi 电子书