Sosse

Sosse
软件描述
SOSSE(Selenium 开源搜索引擎)是一款用 Python 编写的搜索引擎和爬虫,采用 GNU-AGPLv3 许可证发布。它托管在 GitLab 和 GitHub 上,请任选其一提交功能请求、错误报告或合并请求,或发起讨论。
官方网站
访问软件的官方网站了解更多信息
官方认证
gitlab.com
安全链接HTTPS
什么是 Sosse?
SOSSE(Selenium 开源搜索引擎)是一款用 Python 编写的搜索引擎和爬虫,采用 GNU-AGPLv3 许可证发布。它托管在 GitLab 和 GitHub 上,请任选其一提交功能请求、错误报告或合并请求,或发起讨论。
SOSSE 的主要特性包括:
🌍 基于浏览器的抓取:爬虫可使用 Google Chromium 和 Selenium 索引使用 JavaScript 的页面,也可使用 Requests 实现更快的抓取
🏖 低资源需求:SOSSE 完全使用 Python 编写,数据存储使用 PostgreSQL
🖼 离线浏览:SOSSE 可保存网页的 HTML 副本或截图,创建适合离线浏览的归档文件
🔓 身份验证:爬虫可使用提供的凭据自动提交身份验证表单
🔗 搜索引擎快捷方式:可通过快捷搜索查询跳转至外部搜索引擎(有时称为“bang”搜索)
🔖 搜索历史:用户可登录以私密记录其搜索历史

