全文检索技术应用系列(二):Solr篇其一(未完成...)

【引言】本篇主要针对基于Lucene引擎的Apache Solr进行一些入门级的阐述,作为Lucene的两大分支之一,Solr的流行度很高,本系列会沿着使用的足迹逐步深入了解Solr的方方面面。


Solr是什么?

  Solr的全称是Apache Solr;和Lucene一样,是Apache基金会的开源项目之一。官方描述如下:Solr is the popular, blazing-fast, open source enterprise search platform built on Apache Lucene™.(Solr是基于Apache Lucene™构建的流行,快速,开源的企业搜索平台。)

Solr和ElasticSearch的对比

  提到Solr,Elasticsearch就不得不提,关于二者的选择比较,大概有这些点可以说说:

  • 二者安装都很简单,平分秋色;
  • 二者都提供REST风格的API,使用起来复杂度没有太多本质的区别。
  • Solr 利用 Zookeeper 进行分布式管理(特别针对高流量进行优化),而 Elasticsearch 自身带有分布式协调管理功能;
  • Solr 支持更多格式的数据(HTML、PDF、微软 Office 系列软件格式以及 JSON、XML、CSV等),而 Elasticsearch 仅支持json文件格式;
  • Solr 官方提供的功能更多,而 Elasticsearch 本身更注重于核心功能,高级功能多有第三方插件提供;
  • Solr 在传统的搜索应用中表现好于 Elasticsearch,但在处理实时搜索应用时效率明显低于 Elasticsearch;
  • 相比来说Solr有一个更大、更成熟的用户、开发和贡献者社区。

安装Solr环境

  作为一个新工具的开端,搭建环境是最基础的

------2019 Lin.C ------