Apache Nutch

Apache Nutch

Apache Nutch

网络爬虫工具

软件描述

Apache Nutch 是一个高度可扩展且可伸缩的开源网络爬虫软件项目。

官方网站

访问软件的官方网站了解更多信息

官方认证

nutch.apache.org

安全链接HTTPS

什么是 Apache Nutch?

Apache Nutch 是一个高度可扩展且可伸缩的开源网页爬虫软件项目。
Nutch 完全使用 Java 编程语言编写,但数据以与语言无关的格式存储。它具有高度模块化的架构,允许开发者为媒体类型解析、数据获取、查询和聚类创建插件。
抓取器(“机器人”或“网络爬虫”)是为此项目专门从零开始编写的。

🔄 替代方案

10 个选择

Kaddara 是一个专为需要获取新客户线索以开展业务的专业人士设计的平台,其业务受竞争对手运营情况的影响。

付费 • 专有
查看详情
ACHE Crawler

ACHE Crawler

网络爬虫工具

ACHE 是一个用于特定领域搜索的网络爬虫。

免费 • 开源
查看详情
上一页
下一页