Mahout运行版本:
- mahout-0.5, mahout-0.6, mahout-0.7,是基于hadoop-0.20.2x的。
- mahout-0.8, mahout-0.9,是基于hadoop-1.1.x的。
- mahout-0.7,有一次重大升级,去掉了多个算法的单机内存运行,并且了部分API不向前兼容。
注:“用Maven构建Mahout的开发环境”,文中的 2个例子都是基于单机的内存实现,因此选择0.6版本。Mahout在Hadoop集群中运行会在下一篇文章介绍。
1. 安装Mahout
svn co http://svn.apache.org/repos/asf/mahout/trunk mahout 将mahout从代码库中下载下来,此处下载的是主干代码。在mahout 目录执行mvn install 安装,如果想快一点就跳过单元测试检验的那些个环节,使用mvn clean install -DskipTests=true。注意:如果你当前是在windows下进行编译,一定要确保正确安装了Cygwin+hadoop。这里用几个比较好的教材,讲解如何在windows下安装Hadoop Cluster() (不懂的多看看吧,本人)
如果过程中没有报错的话说明安装成功。这个命令会运行默认设置,它会构建core 和 examples下的源码,并且会把它们打包起来。
2.编译、安装core1). 跳转到core的文件夹
2). Mvn compile
3). Mvn install
3.编译 examples
在编译examples 下的源码前,请要先install core文件夹下的源码
1). 跳转到 examples 文件夹
2). Mvn compile