发现各种软件替代方案,找到更适合您的选择

3

import.io 是一个基于网络的平台,可将机器可读网页的强大功能掌握在您手中。使用我们的工具,无需编程,即可在远短于传统方法的时间内创建 API 或抓取整个网站。

提供 107 个替代方案

5

Diggernaut 是一项基于云的网络爬虫、数据提取及其他 ETL 任务服务。您可在云端调度和运行爬虫,也可在个人电脑上编译并运行。

提供 81 个替代方案

4

易于使用的PDF和电子邮件解析器。利用我们强大的OCR引擎,自动从邮件和PDF中提取文本。 将提取的数据发送至Google表格或数百个已连接的CRM及其他应用。

提供 16 个替代方案

Extracty 可以提取任何网页数据,并为网页信息创建 API。

提供 71 个替代方案

Apache Mahout 是一个 Apache 项目,旨在在 Hadoop 平台上提供分布式或其他可扩展机器学习算法的免费实现。Mahout 仍在开发中;已实现的算法数量迅速增长,但仍存在多种……

提供 4 个替代方案

5

为您的电子商务业务进行数据挖掘。使用 eScraper 从供应商或其他外部网站获取价格、描述、图片及其他数据。

提供 11 个替代方案

Gema 是一个基于模式匹配概念的通用文本处理工具。通常情况下,它读取一个输入文件并将其复制到输出文件,同时根据用户定义的一组模式对数据执行指定的转换。

提供 13 个替代方案

4

ScrapeStorm 是一款基于人工智能的可视化网络爬虫工具,无需编写任何代码即可从几乎任意网站提取数据。它功能强大且非常易于使用,支持 Windows、Mac OS 和 Linux 操作系统。

提供 85 个替代方案

免费数据采集器可让您快速、轻松地从任何网站收集数据。它提供类似Excel的界面,您可以直观地编辑最终文件,并通过我们的点击引导功能轻松捕获所需的网页元素。

PhearJS 使用 PhantomJS 渲染动态网页:获取页面,渲染后返回格式良好的 JSON 对象。PhearJS 既提供托管 API,也提供可自行部署的开源解决方案。

readxl 包可轻松将数据从 Excel 导入 R。与许多现有包(如 gdata、xlsx、xlsReadWrite)相比,readxl 没有外部依赖,因此在所有操作系统上都易于安装和使用。

快速抓取API处理代理服务器、浏览器和验证码,您只需一次简单的API调用即可获取任何网站的HTML!

LibXL 是一个可读写 Excel 文件的库。它无需 Microsoft Excel 和 .NET 框架,且功能强大易用。