ItSucks

ItSucks
软件描述
该项目是一个Java Web爬虫(网络爬虫),具备下载(及断点续传)文件的功能。它还支持正则表达式和下载模板,可高度自定义。
官方网站
访问软件的官方网站了解更多信息
官方认证
itsucks.sourceforge.net
安全链接HTTPS
什么是 ItSucks?
该项目是一个Java Web爬虫(网络爬虫),具备下载(及断点续传)文件的功能。它还支持正则表达式和下载模板的高程度自定义。
应用程序同时提供Swing图形界面和控制台接口。所有后端功能也可独立作为一个库使用,便于在其他项目中集成。
主要功能
🔄 替代方案
36 个选择★4
自托管的归档平台,可将网页内容存储为HTML、PDF、截图、媒体文件和WARC文件;支持从书签、RSS或文件导入链接;具备浏览器历史记录、复杂网站支持、JSON索引、Git仓库归档、定期调度及离线浏览功能。
★5
GNU Wget 是一个免费的软件包,用于通过 HTTP(S) 和 FTP 协议下载文件,这两种协议是目前使用最广泛的互联网协议。它是一个非交互式的命令行工具,因此可轻松从脚本、cron 作业、无 X-Windows 支持的终端等环境中调用。

HTTrack
★4
开源软件,允许用户下载完整网站,保留目录和链接结构,以便离线浏览。支持更新、断点续传及主要操作系统。

Webrecorder
Webrecorder 提供了一套开源工具和软件包,用于捕获交互式网站,并尽可能准确地在以后进行回放。

ScrapBook
★4
ScrapBook 是一个 Firefox 插件,用于帮助您保存网页并管理收藏。主要特点包括轻量、快速、准确和多语言支持。主要功能有:






