Spark实现K-Means算法代码示例

admin 2019-10-13 12:38:14 阅读() 评论()

K-Means算法是一种基于距离的聚类算法，采用迭代的方法，计算出K个聚类中心，把若干个点聚成K类。 MLlib实现K-Means算法的原理是，运行多个K-Means算法，每个称为run，返回最好的那个…

K-Means算法是一种基于距离的聚类算法，采用迭代的方法，计算出K个聚类中心，把若干个点聚成K类。

MLlib实现K-Means算法的原理是，运行多个K-Means算法，每个称为run，返回最好的那个聚类的类簇中心。初始的类簇中心，可以是随机的，也可以是KMean||得来的，迭代达到一定的次数，或者所有run都收敛时，算法就结束。

用Spark实现K-Means算法，首先修改pom文件，引入机器学习MLlib包：

     org.apache.spark   spark-mllib_2.10   1.6.0

本文来自网络，不代表1号站长-站长学院|资讯交流平台立场。转载请注明出处： https://www.1cn.cc/fwq/web/3374.html

标签:

这里可以再内容模板定义一些文字和说明，也可以调用对应作者的简介！或者做一些网站的描述之类的文字或者HTML！