谁搭建过lucene搜索引擎的分布式?是否有具体DEMO?java版的。

最好有完整搭建文档。

apache下的solr 和nurth 等都可以考虑

参考资料:http://lucene.apache.org/java/docs/index.html

温馨提示:内容为网友见解,仅供参考
第1个回答  2011-07-16
你好!

自己下载吧,看看是不是你要的!

开发自己的搜索引擎---Lucene+Heritrix(第2版)内容简介
书中特别关注了Heritrix爬虫技术,讲解了如何利用HTMLParser进行网页抓取,并探讨了DWR在搜索引擎中的应用。作者通过理论与实践的结合,引导读者一步步构建出一个功能强大的垂直搜索系统,这不仅具有很高的商业实用性,还为创新搜索引擎产品的开发提供了坚实的基础。无论你是Java开发者,还是计算机软件开发人员,...

java如何用lucene+nutch搭建分布式搜索引擎?
3.用nutch,一个超强的开源软件,作者就是lucene的作者,该软件的目标是做到和Google一样强大,nutch的很多分布式实现的思想来源于Google,目前已实现分布式crawler,和分布式检索,已经有人用他抓了几亿的网页,nutch功能包括了下载网页,解析网页,计算网页重要度,建索引,前台搜索等一个搜索引擎需要的绝大部分功能,...

java中通过Elasticsearch实现全局检索功能的方法和步骤及源代码_百度...
步骤1:添加依赖首先,你需要在项目中添加Elasticsearch Java客户端的Maven依赖,找到对应版本号(例如:{version})后,将以下代码添加到pom.xml文件中:步骤2:连接Elasticsearch通过RestHighLevelClient连接Elasticsearch,如示例所示:步骤3:创建索引在进行检索前,需创建索引,如下所示:步骤4:添加文档创建...

为什么说Lucene不好?
对那些刚接触Lucene的人来说,这里是使用它的关键:Apache Lucene是一个由java编写的高性能,全方位的单词搜索引擎库。 在批评它之前,我必须承认Lucene是一个高性能的划词搜索引擎。几年来,Lucene已经被看作是用java编写的嵌入式搜索引擎中的一等公民。它的声誉每日剧增,并且仍然是开源java搜索引擎中的最佳。每个人都...

为什么说Lucene不好
对那些刚接触Lucene的人来说,这里是使用它的关键:Apache Lucene是一个由java编写的高性能,全方位的单词搜索引擎库。在批评它之前,我必须承认Lucene是一个高性能的划词搜索引擎。几年来,Lucene已经被看作是用java编写的嵌入式搜索引擎中的一等公民。它的声誉每日剧增,并且仍然是开源java搜索引擎中的最佳。每个人都在...

2.Lucene&ES全文搜索
Lucene基于Java开发,提供了一个强大的全文检索引擎,包括创建索引、搜索索引等核心功能。入门程序涵盖了依赖导入、索引创建和搜索索引的基本操作。ElasticSearch是Lucene的进一步发展,是一个开源、高性能的分布式全文检索引擎。它支持实时存储、检索数据,并具备扩展性、简单操作、Resultful API通信方式、集群支持...

Lucene Java精华版内 容简介
在全文检索部分,本书结合Lucene 3.0,深入解析了搜索引擎的原理与最新进展,通过简单实例演示了Lucene的实现方法。书中详细介绍了从完成索引到构建搜索用户界面的完整过程,以及如何实现准实时搜索,包括使用Solr 1.4版本和构建分布式搜索服务集群的方法。此外,本书还展示了在地理信息系统和户外活动搜索领域...

(2007-5-22更新)Lucene(Nutch)距离商业文本搜索引擎还有多远?
Lucene是一个开源的基于java的搜索引擎,它只包含IR(Information Retrieve)部分。它即不是唯一的也不是最好的一个开源搜索引擎,更好的比如egothor,但是它是文档最全面和受到关注最多的一个。Nutch是基于Lucene并加入了分布式和Crawler部分的搜索引擎。在本文中,作者试图从掌握的知识范围谈论一下它们使用的技术和一般商业...

搜索引擎开发权威经典目录
最后,第8章介绍了Lius类库,一个强大的工具,用于解析各种格式的数据,如Word、Excel、PDF等,以及HTML数据。本书的高级部分(第9-16章)分别深入讨论了索引和搜索的高级知识,以及Lucene在实际应用中的丰富实例,最后还介绍了Nutch搜索引擎框架,一个基于Lucene的分布式搜索引擎系统。

开源免费的大数据存储-搜索引擎
Solr使用Java编写,并运行在Servlet容器(如Apache Tomcat或Jetty)中。它具有RESTful HTTP\/XML和JSON API,并且具有强大的外部配置功能,使得无需进行Java编码即可调整以适应多种类型的应用程序。3. Easysearch - 一个分布式的近实时搜索与分析引擎,核心引擎基于开源的Apache Lucene。它是一个轻量级的...

相似回答