WebScrapBook

5

软件描述

一种浏览器扩展程序,可将网页捕获到本地设备或后端服务器,以便日后检索、整理、注释和编辑。

官方网站

访问软件的官方网站了解更多信息

官方认证

github.com

安全链接HTTPS

什么是 WebScrapBook?

WebScrapBook 是一款浏览器扩展程序,能够以多种存档格式和可自定义配置的方式忠实地捕获网页内容,以便日后检索、整理、注释和编辑。该项目继承自旧版 Firefox 插件 ScrapBook X。

功能特性:

忠实地捕获:在浏览器中显示的网页内容可以被完整捕获,不会丢失任何细微细节。同时会记录元数据,例如源网址和时间戳。

可自定义捕获:WebScrapBook 可以将网页中的选定区域保存,也可以保存原始网页(在脚本处理前的状态),或将其保存为书签。对于如何捕获图片、音频、视频、字体、框架、样式、脚本等,均可进行自定义设置。网页可被保存为文件夹、基于 ZIP 的存档文件(HTZ 或 MAFF)或单个 HTML 文件。

可组织的收藏夹:捕获的网页内容可以通过浏览器侧边栏中的一个或多个“收藏夹”进行整理。每个收藏夹都支持层次化的树形结构来组织数据项,并可进一步索引,以实现功能丰富的搜索(支持标题、全文关键词、自定义备注、源网址或其他元数据的组合查询)。(*)

页面编辑:在捕获网页之前或之后,可以对网页内容进行高亮、注释或编辑。此外,还可以使用 HTML 或 Markdown 格式创建和管理笔记。(*)

远程访问:捕获的数据可以托管在中央后端服务器上,并可在其他设备上读取或编辑。或者,可以为某个收藏夹生成静态站点索引,从而将其托管在不支持动态网页托管的共享 Web 服务器上。(*)

移动设备支持:WebScrapBook 支持移动浏览器,如 Firefox for Android 和 Kiwi 浏览器。

对旧版 ScrapBook 的兼容支持:由旧版 ScrapBook(X)创建的收藏夹可以转换为 WebScrapBook 兼容格式,以便使用。(*)

• 上述所有或部分功能需要一个运行中的协作式后端服务器支持,该服务器可通过 PyWebScrapBook 方便地搭建。

🔄 替代方案

41 个选择
Nimbus Clipper

Nimbus Clipper

笔记工具

1

功能正常的网页剪辑器!最简单的方式,可从网页中剪裁文本、图片、链接、邮件和PDF,并将其保存。

免费增值 • 专有
查看详情
PageArchiver

PageArchiver

软件

PageArchiver(此前称为“SingleFile的剪贴簿”)是一款Chrome扩展程序,可帮助您为离线阅读存档网页。

免费 • 开源
查看详情

该项目是一个基于 Java 的网络爬虫(网页蜘蛛),具备下载(并支持断点续传)文件的功能,同时支持正则表达式和下载模板,高度可定制化。

免费 • 开源
查看详情
Offline Explorer

Offline Explorer

网站下载器

在 Windows 上下载网页和 FTP 站点以供离线使用,支持批量和定时任务、选择性下载、Chromium 引擎、密码保护、社交网站内容抓取,以及将项目或设置迁移到新系统或外部介质。

付费 • 专有
查看详情

grab-site 是一个用于将网站归档为 WARC 文件的爬虫工具。它包含一个仪表板,用于监控多个爬取任务,并支持在爬取过程中更改 URL 忽略模式。

免费 • 开源
查看详情
3.2

ScrapBook X 是一个基于 ScrapBook Plus 并融合了最新版本 ScrapBook 多个功能的 Firefox 插件。

免费 • 开源
查看详情
SingleFileZ

SingleFileZ

软件

用于 Firefox/MS Edge 的网页扩展和命令行工具,可将整个网页完整保存为一个可自我解压的 HTML/ZIP 多语言文件。

免费 • 开源
查看详情
MarkDownload

MarkDownload

软件

5

这是对剪辑网站并将其下载为可读的 Markdown 文件的扩展。请注意,该功能并不能保证在所有网站上都能正常工作。

免费 • 开源
查看详情
上一页下一页