Whoosh

Whoosh
软件
软件描述
Whoosh 是一个用于索引文本并搜索索引的类和函数库。它允许你为你的内容开发自定义搜索引擎。
官方网站
访问软件的官方网站了解更多信息
whoosh.readthedocs.io
什么是 Whoosh?
Whoosh 是一个用纯 Python 实现的快速、功能丰富的全文索引和搜索库。程序员可以使用它轻松为自己的应用程序和网站添加搜索功能。Whoosh 的每个部分都可以扩展或替换,以完全满足您的需求。
Whoosh 的一些特性包括:
- Python 风格的 API。
- 纯 Python 实现,无需编译或二进制包,无神秘崩溃问题。
- 字段化索引与搜索。
- 快速索引与检索——比我知道的任何其他纯 Python 搜索解决方案都快。参见基准测试。
- 可插拔的评分算法(包括 BM25F)、文本分析、存储、倒排列表格式等。
- 功能强大的查询语言。
- 生产级纯 Python 拼写检查器(据我所知,这是唯一的)。
Whoosh 在以下情况下可能很有用:
- 任何需要纯 Python 解决方案以避免构建/编译原生库(或强制用户自行构建/编译)的场景。
- 作为研究平台(至少对那些觉得 Python 比 Java 更易读和使用而言)。
- 当您更看重易用的 Python 风格接口而非极致速度时。
- 当您的应用能良好利用一个深度集成的搜索/查找解决方案,并可依赖其始终可用,而不必同时维护两种不同的搜索方案(一种简单/慢/自研的集成方案,另一种快速/外部的二进制依赖方案)。
Whoosh 由 Matt Chaput 创建并维护。最初是为 Side Effects Software 公司的 3D 动画软件 Houdini 的在线帮助系统开发的。Side Effects Software Inc. 慷慨地同意将代码开源。
🔄 替代方案
20 个选择ParadeDB
ParadeDB 是一个基于 Postgres 的现代 Elasticsearch 替代方案,专为实时、更新频繁的工作负载设计。

Canary - Search & Ask AI
技术文档的Algolia替代方案。

Qdrant
Qdrant(读作“quadrant”)是一个向量相似性搜索引擎和向量数据库。它提供了一个开箱即用的服务,通过便捷的API实现点(带附加负载的向量)的存储、搜索和管理,专为支持扩展过滤而设计。

Magifind
Magifind利用先进的人工智能和自然语言处理技术,真正理解客户搜索背后的意图,而不仅仅是匹配关键词。这种语义搜索方法使Magifind能够返回高度相关的结果,引导客户找到他们所需的精确产品……

Tribus
企业搜索,简单高效。基于云的企业搜索解决方案,可跨您组织内所有内容源进行搜索——Aconex、Procore、Dropbox、Microsoft SharePoint、OneDrive 等。

FreeFind
免费网站搜索引擎。今天起在您的网站上添加一个免费的网站搜索引擎,不到十分钟即可完成。可选择免费版或专业版网站搜索引擎。


