python kmeans聚类简单介绍和实现代码 -凯发娱发k8

一、k均值聚类的

假设样本分为c类，每个类均存在一个中心点，通过随机生成c个中心点进行迭代，计算每个样本点到类中心的距离（可以自定义、常用的是欧式距离）

将该样本点归入到最短距离所在的类，重新计算聚类中心，进行下次的重新划分样本，最终类中心不改变时，聚类完成

二、伪代码

三、python代码实现

#!/usr/bin/env python 
# coding=utf-8 
 
import numpy as np 
import random 
import matplotlib.pyplot as plt 
 
#data:numpy.array dataset 
#k the number of cluster 
def k_means(data,k): 
   
  #random generate cluster_center 
  sample_num=data.shape[0] 
  center_index=random.sample(range(sample_num),k) 
  cluster_cen=data[center_index,:] 
 
  is_change=1 
  cat=np.zeros(sample_num) 
   
 
  while is_change: 
    is_change=0 
 
    for i in range(sample_num): 
      min_distance=100000 
      min_index=0 
 
      for j in range(k): 
        sub_data=data[i,:]-cluster_cen[j,:] 
        distance=np.inner(sub_data,sub_data) 
        if distance
以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持本站。

相关推荐

python如何实现自定义读写分离

01072024

这篇文章将为大家详细讲解有关python如何实现自定义读写分离，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。思路自定义session类重写get_bind方法根据self._fl...
python如何实现xml解析

01072024

这篇文章将为大家详细讲解有关python如何实现xml解析，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。三种方法：一是xml.dom.*模块，它是w3c dom api的实现，若需要处理do...
python爬取豆瓣视频信息代码实例

01072024

这篇文章主要介绍了python爬取豆瓣视频信息代码实例,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下这里是爬取豆瓣视频信息，用pyquery库(jquery的python...
如何使用python操作es

01072024

这篇文章主要为大家展示了“如何使用python操作es”，内容简而易懂，条理清晰，希望能够帮助大家解决疑惑，下面让小编带领大家一起研究并学习一下“如何使用python操作es”这篇文章吧。安装 pip install ...
python爬虫爬取笔趣网小说网站过程图解

01072024

首先：文章用到的解析库介绍 beautifulsoup： beautiful soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱，通过解析文档为用户提供需要抓取的数据，因为简单，所以不...
基于python实现雪花算法过程详解

01072024

这篇文章主要介绍了基于python实现雪花算法过程详解,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 snowflake是twitter提出来的一个算法，其目的是生成一...
python大数据之网络爬虫的post请求、get请求区别实例分析

01072024

本文实例讲述了python大数据之网络爬虫的post请求、get请求区别。分享给大家供大家参考，具体如下：在jetbrains pycharm 2016.3软件中编写代码前，需要指定python和编码方式： #!user/bin/python 编码方式 ...
python中有哪些交换数值的方法

01072024

这篇文章主要介绍了python中有哪些交换数值的方法，此处通过实例代码给大家介绍的非常详细，对大家的学习或工作具有一定的参考价值，需要的朋友可以参考下： python可以做什么 python是一种编程语言，内置了许多...