雷思软件

返回软件列表

WebHarvy

WebHarvy

WebHarvy

网络爬虫工具, 数据挖掘软件

★4

软件描述

使用 WebHarvy，您可以轻松地从任何网站抓取文本、HTML、图片、URL 和电子邮件，并将抓取的数据保存为多种格式。

官方网站

访问软件的官方网站了解更多信息

官方认证

www.webharvy.com

安全链接HTTPS

什么是 WebHarvy?

WebHarvy 是一款 Windows 桌面应用程序，通过简单易用的点按式用户界面，可从任意网站抓取无限量数据。

主要功能
🌎 从任意网站抓取数据
? 抓取文本、图片、URL、电子邮件、页面截图、HTML 内容等
🌲 抓取多级分类列表（例如电商网站的商品分类）
🔑 向搜索表单提交多个关键词并抓取结果
📃 支持网站使用的所有类型分页技术
🔏 支持使用代理（并自动轮换）实现匿名抓取
💾 将抓取的数据保存为文件——CSV、XML、Excel、TSV、JSON
🌐 将抓取的数据保存到数据库——MySQL、SQL Server、Oracle
🌎 自动化浏览器操作——点击、滚动、下拉选择、输入文本等
👤 使用用户名和密码登录网站
👩?💻 在页面上运行自定义 JavaScript 代码
👩?💻 使用正则表达式（RegEx）精确选取数据
? 定时抓取——无需人工干预的周期性抓取
👩?💻 支持命令行调用——可从其他应用或脚本中启动 WebHarvy
💻 本地安装于您的计算机
💰 一次性授权费用，无持续付费

与云端抓取平台不同，您抓取数据的数量及网站数量均无限制。我们为用户提供优质的客户支持，这使我们在与企业级网络抓取平台的竞争中脱颖而出。

主要功能

✓ 无需编码 ✓ 数据挖掘 ✓ 自动数据提取

🔄 替代方案

82 个选择

UiPath

网络爬虫工具

★3

一个免费、功能完整且可扩展的工具，用于自动化任何网页或桌面应用程序。UiPath Studio 社区版对个人开发者、小型专业团队、教育和培训用途均免费。

Scrapy

网络爬虫工具, 数据挖掘软件

★5

Scrapy 是一个用 Python 编写的免费开源网络爬取框架。最初为网页抓取而设计，也可用于通过 API 提取数据或作为通用网络爬虫。它由 Zyte（前身为 Scrapinghub）开发并维护，是一家网络抓取公司。

import.io

网络爬虫工具, 数据挖掘软件

★3

import.io 是一个基于网络的平台，可将机器可读网页的强大功能掌握在您手中。使用我们的工具，无需编程，即可在远短于传统方法的时间内创建 API 或抓取整个网站。

Flyscrape

网络爬虫工具

0

Flyscrape 是一个独立且可脚本化的网页爬虫，结合了 Go 语言的速度与 JavaScript 的灵活性。—— 专注于数据提取，而非请求处理。

Lookyloo

网络爬虫工具

0

Lookyloo 是一个网页界面，允许用户捕获网站页面，然后显示相互调用的域名树。

Lindra AI

工作流自动化工具

0

使用AI代理自动化任何网站，其操作如同真人般点击、筛选和导航。类似于UiPath，但可通过自然语言使用。

Reworkd

网络爬虫工具

0

Reworkd 可在无需编码或维护的情况下，轻松实现大规模网页数据提取。它自动化了整个网页数据流程，包括扫描网站、生成代码、运行提取器、验证结果并输出数据。

Portia

网络爬虫工具

0

Portia 是一款开源的可视化抓取工具，无需任何编程知识即可抓取网站！只需标注您感兴趣的页面，Portia 就会自动生成爬虫，从相似页面中提取数据。

第 1 页，共 11 页下一页

许可证免费增值 • 专有

评分4.0 / 5.0

支持平台

标签

网页数据提取网络爬虫匿名网络爬取数据提取网络爬取