Terrier

Terrier
软件描述
Terrier 是一个高度灵活、高效且有效的开源搜索引擎,可轻松部署在大规模文档集合上。
官方网站
访问软件的官方网站了解更多信息
terrier.org
安全链接HTTPS
什么是 Terrier?
Terrier 是一个高度灵活、高效且有效的开源搜索引擎,可轻松部署在大规模文档集合上。Terrier 实现了最先进的索引与检索功能,为大规模检索应用的快速开发和评估提供了理想的平台。
功能概述:
高效
Terrier 可对大规模文档集合进行索引,并提供多种索引策略,例如多轮索引和大规模单轮索引。同时,通过可更新的索引结构,支持对文档流的实时索引。
有效
提供了最先进的检索方法,如偏离随机性模型(Divergence From Randomness)、BM25F 以及术语依赖的邻近性模型。内置支持通过“学习排序”(Learning to Rank)实现监督排序模型。
灵活
Terrier 非常适合进行信息检索实验,可对所有已知的 TREC 测试集进行索引和批量检索实验,并提供实验结果评估工具。
多语言支持
Terrier 内部使用 UTF-8 编码,可支持除英语以外的多种语言的语料库。
可扩展
Terrier 采用插件架构,易于扩展,可用于开发新的检索技术、增加新的排序功能,或对索引压缩等底层功能进行实验。
交互式
可通过便捷的桌面搜索应用程序查看检索结果,也可通过 JSP 网页界面或提供的网站搜索应用在线查看。使用 Terrier-Spark 在笔记本中规划并执行实验。