Terrier

软件描述

Terrier 是一个高度灵活、高效且有效的开源搜索引擎,可轻松部署于大规模文档集合上。

官方网站

访问软件的官方网站了解更多信息

官方认证

terrier.org

安全链接HTTPS

什么是 Terrier?

Terrier 是一个高度灵活、高效且有效的开源搜索引擎,可轻松部署于大规模文档集合。Terrier 实现了前沿的索引与检索功能,并为大规模检索应用的快速开发与评估提供了理想平台。

特性概览: 高效
Terrier 可对大规模文档语料进行索引,支持多种索引策略,如多遍索引和大规模单遍索引。通过可更新的索引结构,还支持文档流的实时索引。

有效
提供前沿的检索方法,如偏离随机性模型(Divergence From Randomness)、BM25F 以及词项依赖接近模型。内置支持基于学习排序(Learning to Rank)的监督排序模型。

灵活
Terrier 非常适合开展信息检索实验,可对所有已知的 TREC 测试集进行索引与批量检索实验,并包含用于评估实验结果的工具。

多语言
Terrier 内部使用 UTF 编码,可支持英文以外的其他语言语料。

可扩展
Terrier 采用插件架构,易于扩展以开发新的检索技术、添加新的排序特征,或实验底层功能(如索引压缩)。

交互式
可通过便捷的桌面搜索应用程序查看搜索结果,也可通过 JSP 网页界面在线访问,或使用提供的网站搜索应用。还可利用 Terrier-Spark 在笔记本中规划并执行实验。

支持平台

下载与相关链接

安全提示
⚠️

安全提醒

点击下方链接将跳转到第三方网站,请确保来源安全,建议优先从官方网站下载。