Scraperr

Scraperr
软件描述
Scraperr 是一个自托管的网络应用,用户可通过指定 XPath 元素来从网页中抓取数据。用户可以提交 URL 及要抓取的对应元素,结果将以表格形式展示。
官方网站
访问软件的官方网站了解更多信息
scraperr-docs.pages.dev
安全链接HTTPS
什么是 Scraperr?
Scraperr 是一个自托管的网页应用,允许用户通过指定 XPath 元素来从网页中抓取数据。用户可以提交 URL 及需抓取的对应元素,抓取结果将以表格形式展示。
从表格中,用户可下载该任务结果的 Excel 文件,并可选择重新运行该任务。
功能:
提交抓取任务
- 提交/排队 URL 以进行网页抓取
- 使用 XPath 添加和管理需抓取的元素
- 抓取同一域名下的所有页面
- 为请求添加自定义 JSON 头信息
- 展示抓取数据的结果
管理历史任务
- 下载包含结果的 CSV 文件
- 重新运行任务
- 查看排队任务的状态
- 收藏并查看收藏的任务
用户管理
- 用户登录/注册以管理任务(可选)
日志查看
- 在网页界面内查看应用日志
统计视图
- 查看已运行任务的小型统计信息
AI 集成
- 将选定任务的结果纳入对话上下文中
目前支持:Ollama、OpenAI