山田浩之(作者)
信息工程学博士。先后于日本IBM、雅虎从事分布式搜索引擎的研发工作。目前在东京大学生产技术研究所从事高性能并行数据库的研发工作。
末永匡(作者)
开源搜索引擎Senna/Groonga的开发者。每天都在奋斗,梦想着能创建一个更加自由、更加无拘无束的,而不是一家独大的应用程序平台。
胡屹(译者)
多年从事Web开发工作。热爱编程,关注设计模式,致力于提升软件开发的质量。曾获得SCJP和PHP ZCE证书。译有《计算机是怎样跑起来的》。
发表于2024-12-25
自制搜索引擎 2024 pdf epub mobi 电子书
本书主要讲解了:如何从零开始,编写一个基于“倒排索引”(Inverted Index)的“全文检索引擎”(FullText Search Engine)。最终的成果,相当于一个迷你版的Apache Lucene。(注意:是自制Lucene,而不是调用Lucene) 《自制搜索引擎》详细书评:[Blog链接] 书籍附带的迷你全...
评分在此之前还看过《这就是搜索引擎 : 核心技术详解 》,以及翻阅过图书馆一两本搜索相关教科书。 其他书,都是部分概念讲得还行,但是极少有真正的代码讲解。 该书经典之处, 一是行文思路逻辑清晰,编排合理。搜索原理、倒排索引核心与实现、检索排序、搜索的优化,以及还有哪...
评分1. 第一章“搜索引擎是如何工作的”是我感觉收获最多的一部分,把倒排说明说得比较清楚,通过一些插图能容易理解倒排索引对于搜索的核心作用; 2. 本书是通过C语言来实现一个小型的搜索引擎,代码量比较少而且都比较清楚,对于实现一个搜索引擎的理解是很有帮助的; 3. 另外还...
评分在此之前还看过《这就是搜索引擎 : 核心技术详解 》,以及翻阅过图书馆一两本搜索相关教科书。 其他书,都是部分概念讲得还行,但是极少有真正的代码讲解。 该书经典之处, 一是行文思路逻辑清晰,编排合理。搜索原理、倒排索引核心与实现、检索排序、搜索的优化,以及还有哪...
评分1. 第一章“搜索引擎是如何工作的”是我感觉收获最多的一部分,把倒排说明说得比较清楚,通过一些插图能容易理解倒排索引对于搜索的核心作用; 2. 本书是通过C语言来实现一个小型的搜索引擎,代码量比较少而且都比较清楚,对于实现一个搜索引擎的理解是很有帮助的; 3. 另外还...
图书标签: 搜索引擎 计算机 编程 Programming 软件开发 计算机科学技术 IT search
《自制搜索引擎》聚焦于Google和Yahoo!等Web搜索服务幕后的搜索引擎系统,首先讲解了搜索引擎的基础知识和原理,接着以现实中的开源搜索引擎Senna/Groonga为示例,使用该引擎的源代码引导读者亲自体验搜索引擎的开发过程。这部分讲解涉及了倒排索引的制作和压缩、检索的处理流程以及搜索引擎的优化等内容。又简单介绍了一些更加专业的搜索引擎的知识和要点,为读者今后进一步学习打下了基础。本书适合所有对搜索引擎感兴趣的技术人员阅读。
我们还需要努力,加油,有恒!
评分开头讲述倒排索引的部分比较清晰,后面的编程部分草草略过~
评分Lucene学习前了解下搜索引擎
评分Lucene学习前了解下搜索引擎
评分感谢 胡屹 的签名赠书
自制搜索引擎 2024 pdf epub mobi 电子书