strigi
💻
strigi
软件
软件描述
一个小型守护进程,可使用新的爬虫索引信息。 非常快速的爬取 内存占用极小 不会对系统造成过大压力 可插拔的后端,目前支持 clucene 和 hyperestraier,sqlite3 和 xapian 正在开发中 守护进程与搜索程序之间的通信
官方网站
访问软件的官方网站了解更多信息
www.vandenoever.info
安全链接HTTPS
什么是 strigi?
一个小型守护进程,可使用新的爬虫索引信息。
非常快速的爬取
非常小的内存占用
不会对系统造成过大压力
可插拔的后端,目前支持 clucene 和 hyperestraier,sqlite3 和 xapian 正在开发中
守护进程与搜索程序之间通过抽象接口通信,目前为简单的套接字,但 dbus 的实现也是可能的。代码中附带一个小型 perl 程序作为查询示例。该接口极为简单,任何 KDE 应用均可轻松实现。
提供简单的接口用于开发信息提取插件。我们将尝试复用 kat 的插件,尽管原生插件在性能上有显著优势
为每个爬取的文件计算 sha1(可快速查找重复文件)