雷思软件

返回软件列表

WebHarvy

WebHarvy

WebHarvy

网络爬虫工具, 数据挖掘软件

★4

软件描述

使用 WebHarvy，您可以轻松地从任何网站抓取文本、HTML、图片、URL 和电子邮件，并将抓取的数据保存为多种格式。

官方网站

访问软件的官方网站了解更多信息

官方认证

www.webharvy.com

安全链接HTTPS

什么是 WebHarvy?

WebHarvy 是一款 Windows 桌面应用程序，通过简单易用的点按式用户界面，可从任意网站抓取无限量数据。

主要功能
🌎 从任意网站抓取数据
? 抓取文本、图片、URL、电子邮件、页面截图、HTML 内容等
🌲 抓取多级分类列表（例如电商网站的商品分类）
🔑 向搜索表单提交多个关键词并抓取结果
📃 支持网站使用的所有类型分页技术
🔏 支持使用代理（并自动轮换）实现匿名抓取
💾 将抓取的数据保存为文件——CSV、XML、Excel、TSV、JSON
🌐 将抓取的数据保存到数据库——MySQL、SQL Server、Oracle
🌎 自动化浏览器操作——点击、滚动、下拉选择、输入文本等
👤 使用用户名和密码登录网站
👩?💻 在页面上运行自定义 JavaScript 代码
👩?💻 使用正则表达式（RegEx）精确选取数据
? 定时抓取——无需人工干预的周期性抓取
👩?💻 支持命令行调用——可从其他应用或脚本中启动 WebHarvy
💻 本地安装于您的计算机
💰 一次性授权费用，无持续付费

与云端抓取平台不同，您抓取数据的数量及网站数量均无限制。我们为用户提供优质的客户支持，这使我们在与企业级网络抓取平台的竞争中脱颖而出。

主要功能

✓ 无需编码 ✓ 数据挖掘 ✓ 自动数据提取

🔄 替代方案

82 个选择

Rinkt

0

Rinkt 是一款免费且可扩展的桌面和网页应用自动化工具。它能够像人类一样学习并执行任务，访问各种信息源。

NetNut

0

NetNut是代理市场的一次革新，为企业提供极速的静态和动态住宅IP代理网络。

Content Grabber

网络爬虫工具

★3

Content Grabber 用于网页抓取和网页自动化。它可以从几乎任何网站提取内容，并将其以您选择的格式保存为结构化数据，包括 Excel 报表、XML、CSV 和大多数数据库。

FetchFox

网络爬虫工具

0

FetchFox 是一款由人工智能驱动的网络爬虫工具。它获取网站的原始文本，并利用人工智能提取用户所需的数据。该工具以 Chrome 扩展程序形式运行，用户可用自然语言描述所需数据。

Crawlbase

网络爬虫工具

★5

Crawlbase（前身为ProxyCrawl）可帮助您在爬取网页时保持匿名，以正确的方式应对网络爬虫防护。

Scraperr

网络爬虫工具

0

Scraperr 是一个自托管的网络应用，用户可通过指定 XPath 元素来抓取网页数据。用户可提交网址及要抓取的对应元素，结果将以表格形式显示。

ScraperAPI

网络爬虫工具

0

ScraperAPI 通过管理IP轮换、无头浏览器和验证码，实现简单高效的网络爬取，简化了从电商、搜索引擎结果页、社交媒体、房地产、旅游网站和评论等平台提取数据的过程。开发者只需提供网址即可轻松获取HTML页面。

Dataflow Kit

网络爬虫工具, 数据挖掘软件

0

使用可视化点按工具从网站提取信息，将网页转换为有用数据。自动化网络上的数据工作流，以任意规模处理和转换数据。

上一页第 3 页，共 11 页下一页

许可证免费增值 • 专有

评分4.0 / 5.0

支持平台

标签

网页数据提取网络爬虫匿名网络爬取数据提取网络爬取