Apache Mahout

Apache Mahout
软件描述
Apache Mahout 是一个 Apache 项目,旨在在 Hadoop 平台上提供分布式或其他可扩展机器学习算法的免费实现。Mahout 仍在开发中;已实现的算法数量迅速增长,但仍存在多种……
官方网站
访问软件的官方网站了解更多信息
mahout.apache.org
什么是 Apache Mahout?
Apache Mahout 是一个 Apache 项目,旨在在 Hadoop 平台上提供分布式或可扩展机器学习算法的免费实现。Mahout 仍在开发中;已实现的算法数量迅速增长,但仍缺少多种算法。尽管 Mahout 的核心聚类、分类和基于批处理的协同过滤算法是基于 Apache Hadoop 使用 MapReduce 模型实现的,但其并不限制贡献仅限于基于 Hadoop 的实现,单节点或非 Hadoop 集群上运行的贡献同样欢迎。例如,Mahout 的“Taste”协同过滤推荐组件最初是一个独立项目,可脱离 Hadoop 独立运行。与 Giraph 等类似 Pregel 的项目集成正在积极讨论中。外部链接:带有 Hadoop 和 Mahout 的 EC2 AMI;Giraph——基于 Hadoop 的图处理基础设施(参见 Pregel);Pregel——Google 内部图处理平台,相关细节已在 ACM 论文中发布。
主要功能
🔄 替代方案
4 个选择
ELKI
ELKI:“支持索引结构的KDD应用开发环境”,是一个用Java编写的数据挖掘算法开发框架。它包含大量常用的数据挖掘算法、距离函数和索引结构。

WEKA
Weka 是一个用于数据挖掘任务的机器学习算法集合,自带图形用户界面。

KEEL
KEEL 是一个开源(GPLv3)Java 软件工具,用于评估进化算法在数据挖掘问题中的应用,包括回归、分类、聚类、模式挖掘等。它包含大量经典的知识提取算法、预处理方法……

SIMON
SIMON 是一款功能强大、灵活、开源且易于使用的知识发现应用。SIMON 实现了机器学习(自动机器学习)和统计数据分析功能,可帮助您揭示动态关系,并为您提供数据的结构化认知……
