python实现k-means算法

 更新时间:2022年01月14日 11:00:16   作者:咕嘟咕嘟_  
K-means算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大,本文介绍python实现k-means算法,需要的小伙伴可以参考一下

聚类属于无监督学习,K-means算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。

下面来看看python实现k-means算法的详细代码吧:

# -*- coding:utf-8 -*-
import random

import numpy as np
from matplotlib import pyplot


class K_Means(object):
? ? # k是分组数;tolerance‘中心点误差';max_iter是迭代次数
? ? def __init__(self, k=2, tolerance=0.0001, max_iter=300):
? ? ? ? self.k_ = k
? ? ? ? self.tolerance_ = tolerance
? ? ? ? self.max_iter_ = max_iter

? ? def fit(self, data):
? ? ? ? self.centers_ = {}
? ? ? ? for i in range(self.k_):
? ? ? ? ? ? self.centers_[i] = data[random.randint(0,len(data))]
? ? ? ? # print('center', self.centers_)
? ? ? ? for i in range(self.max_iter_):
? ? ? ? ? ? self.clf_ = {} #用于装归属到每个类中的点[k,len(data)]
? ? ? ? ? ? for i in range(self.k_):
? ? ? ? ? ? ? ? self.clf_[i] = []
? ? ? ? ? ? # print("质点:",self.centers_)
? ? ? ? ? ? for feature in data:
? ? ? ? ? ? ? ? distances = [] #装中心点到每个点的距离[k]
? ? ? ? ? ? ? ? for center in self.centers_:
? ? ? ? ? ? ? ? ? ? # 欧拉距离
? ? ? ? ? ? ? ? ? ? distances.append(np.linalg.norm(feature - self.centers_[center]))
? ? ? ? ? ? ? ? classification = distances.index(min(distances))
? ? ? ? ? ? ? ? self.clf_[classification].append(feature)

? ? ? ? ? ? # print("分组情况:",self.clf_)
? ? ? ? ? ? prev_centers = dict(self.centers_)

? ? ? ? ? ? for c in self.clf_:
? ? ? ? ? ? ? ? self.centers_[c] = np.average(self.clf_[c], axis=0)

? ? ? ? ? ? # '中心点'是否在误差范围
? ? ? ? ? ? optimized = True
? ? ? ? ? ? for center in self.centers_:
? ? ? ? ? ? ? ? org_centers = prev_centers[center]
? ? ? ? ? ? ? ? cur_centers = self.centers_[center]
? ? ? ? ? ? ? ? if np.sum((cur_centers - org_centers) / org_centers * 100.0) > self.tolerance_:
? ? ? ? ? ? ? ? ? ? optimized = False
? ? ? ? ? ? if optimized:
? ? ? ? ? ? ? ? break

? ? def predict(self, p_data):
? ? ? ? distances = [np.linalg.norm(p_data - self.centers_[center]) for center in self.centers_]
? ? ? ? index = distances.index(min(distances))
? ? ? ? return index


if __name__ == '__main__':
? ? x = np.array([[1, 2], [1.5, 1.8], [5, 8], [8, 8], [1, 0.6], [9, 11]])
? ? k_means = K_Means(k=2)
? ? k_means.fit(x)
? ? for center in k_means.centers_:
? ? ? ? pyplot.scatter(k_means.centers_[center][0], k_means.centers_[center][1], marker='*', s=150)

? ? for cat in k_means.clf_:
? ? ? ? for point in k_means.clf_[cat]:
? ? ? ? ? ? pyplot.scatter(point[0], point[1], c=('r' if cat == 0 else 'b'))

? ? predict = [[2, 1], [6, 9]]
? ? for feature in predict:
? ? ? ? cat = k_means.predict(feature)
? ? ? ? pyplot.scatter(feature[0], feature[1], c=('r' if cat == 0 else 'b'), marker='x')

? ? pyplot.show()

到此这篇关于python实现k-means算法的文章就介绍到这了,更多相关python实现k-means算法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python BeautifulSoup [解决方法] TypeError: list indices must be integers or slices, not str

    Python BeautifulSoup [解决方法] TypeError: list indices must be

    这篇文章主要介绍了Python BeautifulSoup [解决方法] TypeError: list indices must be integers or slices, not str,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-08-08
  • python安装读取grib库总结(推荐)

    python安装读取grib库总结(推荐)

    这篇文章主要介绍了python安装读取grib库总结,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-06-06
  • Pytorch之保存读取模型实例

    Pytorch之保存读取模型实例

    今天小编就为大家分享一篇Pytorch之保存读取模型实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • python实现web方式logview的方法

    python实现web方式logview的方法

    这篇文章主要介绍了python实现web方式logview的方法,涉及Python基于web模块操作Linux命令的技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-08-08
  • 如何解决python多种版本冲突问题

    如何解决python多种版本冲突问题

    这篇文章主要介绍了如何解决python多种版本冲突问题,帮助大家更好的进行python开发,感兴趣的朋友可以了解下
    2020-10-10
  • python列表推导式操作解析

    python列表推导式操作解析

    这篇文章主要介绍了python列表推导式操作解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-11-11
  • Python3爬虫学习之应对网站反爬虫机制的方法分析

    Python3爬虫学习之应对网站反爬虫机制的方法分析

    这篇文章主要介绍了Python3爬虫学习之应对网站反爬虫机制的方法,结合实例形式分析了Python3模拟浏览器运行来应对反爬虫机制的相关操作技巧,需要的朋友可以参考下
    2018-12-12
  • Python中的exec、eval使用实例

    Python中的exec、eval使用实例

    这篇文章主要介绍了Python中的exec、eval使用实例,本文以简洁的方式总结了Python中的exec、eval作用,并给出实例,需要的朋友可以参考下
    2014-09-09
  • 基于python全局设置id 自动化测试元素定位过程解析

    基于python全局设置id 自动化测试元素定位过程解析

    这篇文章主要介绍了基于python全局设置id 自动化测试元素定位过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-09-09
  • 如何给Python代码进行加密

    如何给Python代码进行加密

    这篇文章主要介绍了如何给Python代码进行加密,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-01-01

最新评论