WebScrapBook
软件描述
一种浏览器扩展程序,可将网页捕获到本地设备或后端服务器,以便日后检索、整理、注释和编辑。
官方网站
访问软件的官方网站了解更多信息
github.com
什么是 WebScrapBook?
WebScrapBook 是一款浏览器扩展程序,能够以多种存档格式和可自定义配置的方式忠实地捕获网页内容,以便日后检索、整理、注释和编辑。该项目继承自旧版 Firefox 插件 ScrapBook X。
功能特性:
忠实地捕获:在浏览器中显示的网页内容可以被完整捕获,不会丢失任何细微细节。同时会记录元数据,例如源网址和时间戳。
可自定义捕获:WebScrapBook 可以将网页中的选定区域保存,也可以保存原始网页(在脚本处理前的状态),或将其保存为书签。对于如何捕获图片、音频、视频、字体、框架、样式、脚本等,均可进行自定义设置。网页可被保存为文件夹、基于 ZIP 的存档文件(HTZ 或 MAFF)或单个 HTML 文件。
可组织的收藏夹:捕获的网页内容可以通过浏览器侧边栏中的一个或多个“收藏夹”进行整理。每个收藏夹都支持层次化的树形结构来组织数据项,并可进一步索引,以实现功能丰富的搜索(支持标题、全文关键词、自定义备注、源网址或其他元数据的组合查询)。(*)
页面编辑:在捕获网页之前或之后,可以对网页内容进行高亮、注释或编辑。此外,还可以使用 HTML 或 Markdown 格式创建和管理笔记。(*)
远程访问:捕获的数据可以托管在中央后端服务器上,并可在其他设备上读取或编辑。或者,可以为某个收藏夹生成静态站点索引,从而将其托管在不支持动态网页托管的共享 Web 服务器上。(*)
移动设备支持:WebScrapBook 支持移动浏览器,如 Firefox for Android 和 Kiwi 浏览器。
对旧版 ScrapBook 的兼容支持:由旧版 ScrapBook(X)创建的收藏夹可以转换为 WebScrapBook 兼容格式,以便使用。(*)
• 上述所有或部分功能需要一个运行中的协作式后端服务器支持,该服务器可通过 PyWebScrapBook 方便地搭建。