Whoosh

Whoosh
软件
软件描述
Whoosh 是一个用于索引文本并搜索索引的类和函数库。它允许你为你的内容开发自定义搜索引擎。
官方网站
访问软件的官方网站了解更多信息
whoosh.readthedocs.io
安全链接HTTPS
什么是 Whoosh?
Whoosh 是一个用纯 Python 实现的快速、功能丰富的全文索引和搜索库。程序员可以使用它轻松为自己的应用程序和网站添加搜索功能。Whoosh 的每个部分都可以扩展或替换,以完全满足您的需求。
Whoosh 的一些特性包括:
- Python 风格的 API。
- 纯 Python 实现,无需编译或二进制包,无神秘崩溃问题。
- 字段化索引与搜索。
- 快速索引与检索——比我知道的任何其他纯 Python 搜索解决方案都快。参见基准测试。
- 可插拔的评分算法(包括 BM25F)、文本分析、存储、倒排列表格式等。
- 功能强大的查询语言。
- 生产级纯 Python 拼写检查器(据我所知,这是唯一的)。
Whoosh 在以下情况下可能很有用:
- 任何需要纯 Python 解决方案以避免构建/编译原生库(或强制用户自行构建/编译)的场景。
- 作为研究平台(至少对那些觉得 Python 比 Java 更易读和使用而言)。
- 当您更看重易用的 Python 风格接口而非极致速度时。
- 当您的应用能良好利用一个深度集成的搜索/查找解决方案,并可依赖其始终可用,而不必同时维护两种不同的搜索方案(一种简单/慢/自研的集成方案,另一种快速/外部的二进制依赖方案)。
Whoosh 由 Matt Chaput 创建并维护。最初是为 Side Effects Software 公司的 3D 动画软件 Houdini 的在线帮助系统开发的。Side Effects Software Inc. 慷慨地同意将代码开源。
🔄 替代方案
20 个选择
Qdrant
软件
Qdrant(读作“quadrant”)是一个向量相似性搜索引擎和向量数据库。它提供了一个开箱即用的服务,通过便捷的API实现点(带附加负载的向量)的存储、搜索和管理,专为支持扩展过滤而设计。
免费 • 开源
查看详情
Magifind
软件
★5
Magifind利用先进的人工智能和自然语言处理技术,真正理解客户搜索背后的意图,而不仅仅是匹配关键词。这种语义搜索方法使Magifind能够返回高度相关的结果,引导客户找到他们所需的精确产品……
付费 • 专有
查看详情
Tribus
软件
企业搜索,简单高效。基于云的企业搜索解决方案,可跨您组织内所有内容源进行搜索——Aconex、Procore、Dropbox、Microsoft SharePoint、OneDrive 等。
免费增值 • 专有
查看详情💻
Semantic Image Search CLI
软件
通过命令行工具增强图像搜索功能,利用 node-mlx 实现本地语义搜索。采用 CLIP 模型嵌入并以二进制 JSON 格式存储索引,可实现快速查询且无需依赖第三方服务,即使在大规模图像集合下也能保证高效性。
免费 • 开源
查看详情


