Sosse

软件描述

SOSSE(Selenium 开源搜索引擎)是一款用 Python 编写的搜索引擎和爬虫,采用 GNU-AGPLv3 许可证发布。它托管在 GitLab 和 GitHub 上,请任选其一提交功能请求、错误报告或合并请求,或发起讨论。

官方网站

访问软件的官方网站了解更多信息

官方认证

gitlab.com

安全链接HTTPS
立即访问

什么是 Sosse?

SOSSE(Selenium 开源搜索引擎)是一款用 Python 编写的搜索引擎和爬虫,采用 GNU-AGPLv3 许可证发布。它托管在 GitLab 和 GitHub 上,请任选其一提交功能请求、错误报告或合并请求,或发起讨论。

SOSSE 的主要特性包括:

🌍 基于浏览器的抓取:爬虫可使用 Google Chromium 和 Selenium 索引使用 JavaScript 的页面,也可使用 Requests 实现更快的抓取
🏖 低资源需求:SOSSE 完全使用 Python 编写,数据存储使用 PostgreSQL
🖼 离线浏览:SOSSE 可保存网页的 HTML 副本或截图,创建适合离线浏览的归档文件
🔓 身份验证:爬虫可使用提供的凭据自动提交身份验证表单
🔗 搜索引擎快捷方式:可通过快捷搜索查询跳转至外部搜索引擎(有时称为“bang”搜索)
🔖 搜索历史:用户可登录以私密记录其搜索历史

支持平台

下载与相关链接

安全提醒

点击下方链接将跳转到第三方网站,请确保来源安全,建议优先从官方网站下载。

GitHub