Newspaper

💻

Newspaper

网络爬虫工具

软件描述

Newspaper 是一个使用 Python 3 构建的新闻、全文及文章元数据提取工具。

官方网站

访问软件的官方网站了解更多信息

官方认证

newspaper.readthedocs.io

安全链接HTTPS

什么是 Newspaper?

Newspaper 是一个使用 Python 3 构建的新闻、全文及文章元数据提取工具。特性

支持 10 多种语言（英语、中文、德语、阿拉伯语等…）多线程文章下载框架新闻网址识别从 HTML 提取文本从 HTML 提取顶部图片从 HTML 提取所有图片从文本中提取关键词从文本中提取摘要从文本中提取作者提取谷歌趋势词汇

🔄 替代方案

25 个选择

Kaddara

网络爬虫工具

Kaddara 是一个专为需要获取新客户线索以开展业务的专业人士设计的平台，其业务受竞争对手运营情况的影响。

付费 • 专有

查看详情

ScrapingBot

网络爬虫工具

高效抓取所需的API。

付费 • 专有

查看详情

ScrapeHero

网络爬虫工具, 数据挖掘软件

无需编程或自行搭建工具，即可从网站收集数据的网络爬虫服务。

付费 • 专有

查看详情

Wintr

网络爬虫工具, 数据挖掘软件

免费代理服务和网页抓取API，可使用Cheerio抓取并解析任何网页的HTML，生成个性化项目数据集。

免费 • 专有

查看详情

ScrapingBytes

网络爬虫工具, 数据挖掘软件

ScrapingBytes 使开发者能够轻松抓取网站。我们的服务可渲染 JavaScript 网站，包括单页应用。我们处理无头浏览器、旋转代理（住宅、移动和数据中心）等。

免费增值 • 专有

查看详情

Simplescraper

网络爬虫工具

一款快速、直观且完全免费的浏览器网络爬虫。几秒钟内即可下载网站和表格数据。

免费增值 • 专有

查看详情

Mercury Webparser

网络爬虫工具

仅需一次API请求，Mercury即可提取任意网页文章的相关内容——标题、作者、正文、相关图片等——去除所有无关信息。它可靠、易于使用且免费。

免费 • 专有

查看详情

Lateral.io Article Extractor API

软件

这是一个 REST API，可根据网页 URL 提供文章的全文。注意：底层使用了 'Newspaper'。 https://lateral.io/docs/article-extractor

付费 • 专有

查看详情

第 3 页，共 4 页

许可证免费 • 开源

支持平台

在线访问 [http://newspaper-demo.herokuapp.com/](http://newspaper-demo.herokuapp.com/)自托管 Python Newspaper 是一个 Python3 库