WebScrapBook
软件描述
一个浏览器扩展程序,可将网页捕获到本地设备或后端服务器,以供日后检索、整理、标注和编辑。
官方网站
访问软件的官方网站了解更多信息
github.com
什么是 WebScrapBook?
WebScrapBook 是一款浏览器扩展,可使用多种存档格式和自定义配置,忠实地捕获网页内容,便于未来检索、整理、标注和编辑。本项目继承自旧版 Firefox 插件 ScrapBook X。
特性:
忠实捕获:浏览器中显示的网页可完整捕获,不丢失任何细微细节。同时记录源 URL、时间戳等元数据。 可定制捕获:WebScrapBook 可保存页面选定区域、原始页面(脚本处理前)、或作为书签保存。图像、音频、视频、字体、框架、样式、脚本等内容的捕获方式也可自定义。网页可保存为文件夹、基于 ZIP 的归档文件(HTZ 或 MAFF),或单个 HTML 文件。 可组织的收藏集:捕获的页面可在浏览器侧边栏中通过一个或多个“剪贴簿”进行组织。剪贴簿采用分层树状结构管理数据项,并支持丰富搜索功能(结合标题、全文关键词、自定义注释、源 URL 或其他元数据)。() 页面编辑:可在捕获前后对网页进行高亮、标注或编辑。还可使用 HTML 或 Markdown 格式创建和管理笔记。() 远程访问:捕获的数据可托管于中心后端服务器,从其他设备读取或编辑。也可为剪贴簿生成静态站点索引,从而部署在不支持动态网页托管的共享 Web 服务器上。() 移动端支持:支持移动浏览器,如 Firefox for Android 和 Kiwi 浏览器。 兼容旧版 ScrapBook:由旧版 ScrapBook (X) 创建的剪贴簿可转换为 WebScrapBook 兼容格式使用。() • 上述任一星标功能的全部或部分功能均需运行协作后端服务器,可通过 PyWebScrapBook 轻松搭建。
🔄 替代方案
41 个选择
Nimbus Clipper
好用的网页剪辑工具!轻松截取网页中的文字、图片、链接、邮件和PDF并保存。

PageArchiver
PageArchiver(之前称为“SingleFile Scrapbook”)是一款Chrome扩展程序,可帮助您存档网页以离线阅读。

ItSucks
该项目是一个Java Web爬虫(网络爬虫),具备下载(及断点续传)文件的功能。它还支持正则表达式和下载模板,可高度自定义。

Offline Explorer
在 Windows 上下载网页和 FTP 站点以离线使用,支持批量和计划任务、选择性下载、Chromium 引擎、密码保护、社交网站抓取,以及将项目或设置迁移到新系统或外部介质。

SingleFileZ
适用于 Firefox/MS Edge 的浏览器扩展及命令行工具,可将整个网页保存为一个自解压的 HTML/ZIP 多语言文件。

MarkDownload
这是一个扩展程序,用于截取网页并将其下载为可读的 Markdown 文件。请注意,它并非在所有网站上都能正常工作。




