Apache Lucene

Apache Lucene
软件描述
高性能、功能齐全的全文检索引擎库,完全用Java编写。适用于几乎任何需要全文搜索的应用程序,尤其适合跨平台使用。Apache Lucene 是开源的。
官方网站
访问软件的官方网站了解更多信息
lucene.apache.org
什么是 Apache Lucene?
Apache LuceneTM 是一个用 Java 完全编写、高性能且功能完整的文本搜索引擎库。它适用于几乎所有需要全文搜索的应用程序,尤其适合跨平台使用。
Apache Lucene 是一个开源项目,可免费下载。请使用右侧链接访问 Lucene。
Lucene 通过简单的 API 提供强大的功能:
可扩展的高性能索引
在现代硬件上每小时超过 150GB
内存需求小——仅需 1MB 堆空间
增量索引速度与批量索引相当
索引大小约为所索引文本大小的 20-30%
强大、准确且高效的搜索算法
支持排序搜索——最佳结果优先返回
多种强大查询类型:短语查询、通配符查询、邻近度查询、范围查询等
字段级搜索(如标题、作者、内容)
按任意字段排序
多索引搜索并合并结果
支持同时更新和搜索
灵活的分类、高亮、关联及结果分组
快速、内存高效且容错拼写错误的提示功能
可插拔的排名模型,包括向量空间模型和 Okapi BM25
可配置的存储引擎(编码器)
跨平台解决方案
以 Apache 许可证开源,允许在商业和开源程序中使用
100% 纯 Java 实现
提供其他编程语言的实现版本,且与索引兼容
🔄 替代方案
9 个选择OpenSearch
OpenSearch 是一个由社区驱动的开源搜索和分析套件,源自采用 Apache 2.0 许可证的 Elasticsearch 7.10.2 和 Kibana 7.10.2。它包括一个搜索引擎守护进程以及可视化和用户界面 OpenSearch Dashboards。
Elasticsearch
无与伦比的相关性。实时洞察。当搜索的精准遇上人工智能的智能,一切皆有可能。
ParadeDB
ParadeDB 是一个基于 Postgres 的现代 Elasticsearch 替代方案,专为实时、更新频繁的工作负载设计。

Qdrant
Qdrant(读作“quadrant”)是一个向量相似性搜索引擎和向量数据库。它提供了一个开箱即用的服务,通过便捷的API实现点(带附加负载的向量)的存储、搜索和管理,专为支持扩展过滤而设计。

Milvus
Milvus 是一个开源向量数据库,旨在支持嵌入相似性搜索和人工智能应用。Milvus 使非结构化数据搜索更加便捷,并在不同部署环境中提供一致的用户体验。

Tribus
企业搜索,简单高效。基于云的企业搜索解决方案,可跨您组织内所有内容源进行搜索——Aconex、Procore、Dropbox、Microsoft SharePoint、OneDrive 等。

Tantivy Search Library
它在本质上更接近 Apache Lucene,而非 Elasticsearch 或 Apache Solr,因为它并非现成的搜索引擎服务器,而是一个可用于构建此类搜索引擎的库。


