Terrier

Terrier
软件描述
Terrier 是一个高度灵活、高效且有效的开源搜索引擎,可轻松部署于大规模文档集合上。
官方网站
访问软件的官方网站了解更多信息
terrier.org
安全链接HTTPS
什么是 Terrier?
Terrier 是一个高度灵活、高效且有效的开源搜索引擎,可轻松部署于大规模文档集合。Terrier 实现了前沿的索引与检索功能,并为大规模检索应用的快速开发与评估提供了理想平台。
特性概览:
高效
Terrier 可对大规模文档语料进行索引,支持多种索引策略,如多遍索引和大规模单遍索引。通过可更新的索引结构,还支持文档流的实时索引。
有效
提供前沿的检索方法,如偏离随机性模型(Divergence From Randomness)、BM25F 以及词项依赖接近模型。内置支持基于学习排序(Learning to Rank)的监督排序模型。
灵活
Terrier 非常适合开展信息检索实验,可对所有已知的 TREC 测试集进行索引与批量检索实验,并包含用于评估实验结果的工具。
多语言
Terrier 内部使用 UTF 编码,可支持英文以外的其他语言语料。
可扩展
Terrier 采用插件架构,易于扩展以开发新的检索技术、添加新的排序特征,或实验底层功能(如索引压缩)。
交互式
可通过便捷的桌面搜索应用程序查看搜索结果,也可通过 JSP 网页界面在线访问,或使用提供的网站搜索应用。还可利用 Terrier-Spark 在笔记本中规划并执行实验。