发现各种软件替代方案,找到更适合您的选择

Common Crawl 建立并维护一个开放的网页抓取数据仓库,任何人都可以访问和分析。

提供 49 个替代方案

开源、可扩展的网络爬虫,专为大规模、高质量的网络存档设计,能够保存数字文物,支持模块化插件、分布式爬取、详细监控、任务调度,并以标准化格式导出数据以供长期保存。

提供 16 个替代方案

5

Minexa.ai 是一款下一代工具,通过其他替代方案所不具备的AI驱动解决方案,让网络数据抓取更快、更经济。与那些需要不断调整、在高负载下表现不佳或为自然语言处理额外收费的工具不同,Minexa 能够自动适应……

提供 56 个替代方案

4

SiteCrawler 是一款网站下载工具,可让您捕获整个网站或选定的部分(如图片画廊)。它具备其他应用程序所不具备的强大设置功能。

提供 31 个替代方案

5

Listly 是一款网页扩展程序,无需编程即可简化网络数据抓取。它可帮助您将大量数据收集并导出至 Excel 或 Google Sheets。

提供 58 个替代方案

5

ZennoPoster 是一款功能强大的自动化工具,适用于网络爬虫、数据提取和任务自动化,非常适合数字营销人员、开发者和企业主。

提供 43 个替代方案

自动产品API为初创企业和企业提供准确的按需电商数据提取服务。

提供 55 个替代方案

Sublist3r 是一个使用开源情报(OSINT)来枚举网站子域名的 Python 工具。它帮助渗透测试人员和漏洞猎手收集目标域名的子域名。

提供 7 个替代方案

Infatica 拥有全球范围的住宅IP资源——来自数十个国家真实消费者的超过250万套住宅Socks5代理。通过工单、在线聊天和电话提供支持,紧急技术问题可实现全天候响应。

提供 19 个替代方案

5

基于开源Python的SEO网络爬虫 免费的SEO分析工具 由SEO专家为数字营销专家打造 分析并优化您的站内SEO 审计并识别任何服务器问题 提取您所需的任何页面信息

提供 71 个替代方案

该项目是一个Java Web爬虫(网络爬虫),具备下载(及断点续传)文件的功能。它还支持正则表达式和下载模板,可高度自定义。

提供 36 个替代方案

1

它通过完全使用我们自主研发的命令行网络爬虫程序编写的API进行通信,该爬虫每日更新,用于从可信文件中抓取信息。所使用的公开网络资源可在我们的开源资产数据库中获取,任何人都可贡献自己的开源资源……

提供 62 个替代方案

此网络爬虫的主要目标是使企业搜索集成商和开发人员在处理各种抓取需求时更加便捷。我们希望拥有一个非常可移植、可扩展、模块化且兼容大多数搜索引擎的工具。

提供 1 个替代方案

ACHE 是一个用于特定领域搜索的网络爬虫。

提供 9 个替代方案

使用可视化点按工具从网站提取信息,将网页转换为有用数据。自动化网络上的数据工作流,以任意规模处理和转换数据。

提供 35 个替代方案

Apache Nutch 是一个高度可扩展且可伸缩的开源网络爬虫软件项目。

提供 10 个替代方案

StormCrawler 是一个用于使用 Apache Storm 构建分布式网络爬虫的开源 SDK。该项目采用 Apache 许可证 v2,包含一组主要用 Java 编写的可重用资源和组件。

提供 10 个替代方案

4

使用 WebHarvy,您可以轻松地从任何网站抓取文本、HTML、图片、URL 和电子邮件,并将抓取的数据保存为多种格式。

提供 82 个替代方案

4

一个浏览器扩展,利用人工智能检测可轻松抓取为 CSV 或 Excel 文件的列表类型数据,无需编写代码。可自动点击“下一页”按钮以继续翻页。该扩展在用户浏览器中完全运行。

提供 14 个替代方案

通过SEO Tracer提升您网站的SEO!快速抓取,发现失效链接,分析元标签并进行优化。免费、私密且安全。

提供 51 个替代方案