Carrot2

Carrot2
软件
软件描述
Carrot2 将您的搜索结果整理为各个主题。通过快速概览可用内容,您可迅速找到所需信息。
官方网站
访问软件的官方网站了解更多信息
www.carrot2.org
什么是 Carrot2?
Carrot2 是一个用于文本聚类的编程库,可自动发现相关文档组,并用简短的关键字或短语进行标记。
Carrot2 可将搜索结果标题和摘要等转换为文档组。
网络搜索聚类将公共搜索引擎的结果组织成聚类;提供树状图和饼图形式的聚类可视化。
网页:由 etools.ch 提供的网络搜索结果。大量使用需与 etools.ch 服务所有者另行协商。
PubMed:由 NCBI 提供的医学论文摘要。
本地文件:以 Carrot2 的 XML、JSON、CSV 或 Excel 格式读取本地文件内容。
Solr:查询 Apache Solr 实例。
聚类工作台支持对本地 JSON 或 Excel 文件、Solr 或 Elasticsearch 中的内容进行聚类;支持调整聚类参数,并可将结果导出为 Excel 或 JSON 格式。
Lingo:生成描述清晰的扁平聚类。无法扩展至数千条以上搜索结果。作为开源 Carrot2 框架的一部分提供。
STC:经典的搜索结果聚类算法,生成描述充分的扁平聚类,速度极快。作为开源 Carrot2 框架的一部分提供。
k-means:基准聚类算法,生成词袋风格的聚类描述。作为开源 Carrot2 框架的一部分提供。
🔄 替代方案
15 个选择
Sphinx (search engine)
Sphinx 是一款专为索引数据库内容而设计的软件搜索引擎。目前,它原生支持 MySQL、PostgreSQL 和符合 ODBC 规范的数据库作为数据源。其他数据源可通过自定义 XML 格式通过管道方式进行索引。

Toshi
软件
Toshi 是一个类似于 Elasticsearch 的全文搜索引擎。Toshi 致力于成为 Elasticsearch 所对应的 Tantivy 之于 Lucene 的关系。
Elasticlunr
软件
Elasticlunr.js 是一个轻量级的 JavaScript 全文搜索引擎,适用于浏览器搜索和离线搜索。Elasticlunr.js 基于 Lunr.js 开发,但比 Lunr.js 更加灵活,支持查询时提升权重和字段搜索。



