您的位置首页生活百科

Hadoop生态系统(8)-Mahout简介

Hadoop生态系统(8)-Mahout简介

的有关信息介绍如下:

Hadoop生态系统(8)-Mahout简介

Hadoop生态系统系列

什么是Mahout

–Mahout 是机器学习和数据挖掘的一个分布式框架

–区别于其他的开源数据挖掘软件,它是基于Hadoop之上的MapReduce实现

Mahout的特点

–极强的扩展性:可以很方便的根据数据规模进行扩容,一般情况下不需要重启集群

–良好的容错性: 可以自动的重新运行失败的任务,等,这些都有框架自动完成

–高效的: 它以并行的方式工作,通过并行处理加快处理速度 ,利用集群的威力进行快速的运算

–可移植性较强:因为Mahout是用Java开发的,所以移植性比较好