发现各种软件替代方案,找到更适合您的选择

4

开源软件,允许用户下载完整网站,保留目录和链接结构,以便离线浏览。支持更新、断点续传及主要操作系统。

提供 41 个替代方案

Portia 是一款开源的可视化抓取工具,无需任何编程知识即可抓取网站!只需标注您感兴趣的页面,Portia 就会自动生成爬虫,从相似页面中提取数据。

提供 84 个替代方案

5

互联网上每一台主机的丰富且结构化的信息。非侵入式网络扫描器,WHOIS、域名及SSL证书数据库。

提供 7 个替代方案

grab-site 是一个将网站抓取并存档为 WARC 文件的爬虫。它包含一个用于监控多个抓取任务的仪表板,并支持在抓取过程中更改 URL 忽略模式。

提供 22 个替代方案

Datahut 是一项网络数据抓取服务,帮助公司从网页中获取数据。它使用开源技术,以实惠的价格让您访问网络数据,并避免供应商锁定。最棒的是——100% 退款保证。

提供 54 个替代方案

Wpull 是一个与 wget 兼容的网页下载器和爬虫,支持 WARC 格式以及 Python/Lua 脚本

提供 16 个替代方案

Extracty 可以提取任何网页数据,并为网页信息创建 API。

提供 71 个替代方案

开源、可扩展的网络爬虫,专为大规模、高质量的网络存档设计,能够保存数字文物,支持模块化插件、分布式爬取、详细监控、任务调度,并以标准化格式导出数据以供长期保存。

提供 16 个替代方案

Sublist3r 是一个使用开源情报(OSINT)来枚举网站子域名的 Python 工具。它帮助渗透测试人员和漏洞猎手收集目标域名的子域名。

提供 7 个替代方案

Infatica 拥有全球范围的住宅IP资源——来自数十个国家真实消费者的超过250万套住宅Socks5代理。通过工单、在线聊天和电话提供支持,紧急技术问题可实现全天候响应。

提供 19 个替代方案

该项目是一个Java Web爬虫(网络爬虫),具备下载(及断点续传)文件的功能。它还支持正则表达式和下载模板,可高度自定义。

提供 36 个替代方案

此网络爬虫的主要目标是使企业搜索集成商和开发人员在处理各种抓取需求时更加便捷。我们希望拥有一个非常可移植、可扩展、模块化且兼容大多数搜索引擎的工具。

提供 1 个替代方案

ACHE 是一个用于特定领域搜索的网络爬虫。

提供 9 个替代方案

Apache Nutch 是一个高度可扩展且可伸缩的开源网络爬虫软件项目。

提供 10 个替代方案

StormCrawler 是一个用于使用 Apache Storm 构建分布式网络爬虫的开源 SDK。该项目采用 Apache 许可证 v2,包含一组主要用 Java 编写的可重用资源和组件。

提供 10 个替代方案

5

基于使用量灵活计费的网络爬虫API,提供真实浏览器、旋转移动代理和JavaScript渲染功能。

InterroBot结合桌面网络爬虫与全文及字段搜索功能,帮助您弄清网站当前的状况。

Inout Scripts 是一家领先的软件开发公司,主要专注于克隆脚本、移动应用和电子商务解决方案。我们提供21款脚本及6款移动应用,主要服务于全球125多个国家和地区的小型及中型电子商务企业。

MediaPocket 是一款应用程序,可帮助您即时从喜爱的博客下载照片、视频甚至整个网页。您只需在指定字段中输入合适的博客地址,然后点击主界面中的“播放”按钮即可……

SeekStorm - 搜索即服务:高性能搜索API提供全文、实时、即时搜索与抓取。