慕鸢 (@user792) 在 AI red teamer （人工智能红队）系列08-人工智能基础-k-均值算法（英文：k-means clustering）中发帖AI red teamer （人工智能红队）系列08-人工智能基础-k-均值算法（英文：k-means clustering）k-均值算法是一种流行的无监督学习算法，用于将数据集划分为 K 个不同的、不重叠的簇

慕鸢 (@user792) 在 AI red teamer （人工智能红队）系列08-人工智能基础-k-均值算法（英文：k-means clustering）中发帖

AI red teamer （人工智能红队）系列08-人工智能基础-k-均值算法（英文：k-means clustering）
k-均值算法是一种流行的无监督学习算法，用于将数据集划分为 K 个不同的、不重叠的簇。其目的是将相似的数据点分组，而相似性通常是通过多维空间中数据点之间的距离来衡量的。 
假设存在一个客户数据集，其中包含有关客户购买历史、人口统计和浏览活动的信息。k-均值算法可根据这些客户的相似性将其划分为不同的细分市场。这对于有针对性的营销、个性化推荐和客户关系管理非常有价值。 
k-均值算法 是一种迭代算法，旨在最小化每个聚类内部的方差。这意味着它试图对数据点进行分组，使一个聚类中的点尽可能相互接近，并尽可能远离其他聚类中的数据点。 
该算法执行步骤如下 

初始化： 从数据集中随机选择 K 个数据点作为初始聚类中心（中心点）。这些中心点代表每个聚类中的平均点。
分配： 根据...