亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

基于Python的K-Means聚類數據分析是怎樣的呢

發布時間:2021-12-09 09:45:30 來源:億速云 閱讀:150 作者:柒染 欄目:大數據

基于Python的K-Means聚類數據分析是怎樣的呢,很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。

基于Python的K-Means聚類數據分析

在數據挖掘中,K-Means算法是一種 cluster analysis 的算法,其主要是來計算數據聚集的算法,主要通過不斷地取離種子點最近均值的算法。

來源于維基百科,自由的百科全書的解釋:

k-平均算法源于信號處理中的一種向量量化方法,現在則更多地作為一種聚類分析方法流行于數據挖掘領域。k-平均聚類的目的是:把n個點(可以是樣本的一次觀察或一個實例)劃分到k個聚類中,使得每個點都屬于離他最近的均值(此即聚類中心)對應的聚類,以之作為聚類的標準。這個問題將歸結為一個把數據空間劃分為Voronoi cells的問題。


在數據挖掘中,K-Means算法是一種cluster analysis的算法,其主要是來計算數據聚集的算法,主要通過不斷地取離種子點最近均值的算法。

問題

K-Means算法主要解決的問題如下圖所示。我們可以看到,在圖的左邊有一些點,我們用肉眼可以看出來有四個點群,但是我們怎么通過計算機程序找出這幾個點群來呢?于是就出現了我們的K-Means算法。基于Python的K-Means聚類數據分析是怎樣的呢

算法概要  

這個算法其實很簡單,如下圖所示:

基于Python的K-Means聚類數據分析是怎樣的呢

從上圖中,我們可以看到,A,B,C,D,E是五個在圖中點。而灰色的點是我們的種子點,也就是我們用來找點群的點。有兩個種子點,所以K=2。

然后,K-Means的算法如下:

  1. 隨機在圖中取K(這里K=2)個種子點。

  2. 然后對圖中的所有點求到這K個種子點的距離,假如點Pi離種子點Si最近,那么Pi屬于Si點群。(上圖中,我們可以看到A,B屬于上面的種子點,C,D,E屬于下面中部的種子點)

  3. 接下來,我們要移動種子點到屬于他的“點群”的中心。(見圖上的第三步)

  4. 然后重復第2)和第3)步,直到,種子點沒有移動(我們可以看到圖中的第四步上面的種子點聚合了A,B,C,下面的種子點聚合了D,E)。


這個算法很簡單,但是有些細節我要提一下,求距離的公式我不說了,大家有初中畢業水平的人都應該知道怎么算的。我重點想說一下"求點群中心的算法"。

求點群中心的算法

一般來說,求點群中心點的算法你可以很簡的使用各個點的X/Y坐標的平均值。不過,我這里想告訴大家另三個求中心點的的公式:

1)Minkowski Distance公式——λ可以隨意取值,可以是負數,也可以是正數,或是無窮大。

基于Python的K-Means聚類數據分析是怎樣的呢

2)Euclidean Distance公式——也就是第一個公式λ=2的情況

3)CityBlock Distance公式——也就是第一個公式λ=1的情況

基于Python的K-Means聚類數據分析是怎樣的呢

這三個公式的求中心點有一些不一樣的地方,我們看下圖(對于第一個λ在0-1之間)。

基于Python的K-Means聚類數據分析是怎樣的呢

上面這幾個圖的大意是他們是怎么個逼近中心的,第一個圖以星形的方式,第二個圖以同心圓的方式,第三個圖以菱形的方式。

看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

和林格尔县| 姚安县| 锡林郭勒盟| 华阴市| 收藏| 高台县| 台湾省| 庆城县| 儋州市| 铜鼓县| 休宁县| 斗六市| 濮阳县| 海城市| 平塘县| 衡阳县| 祁门县| 富民县| 嘉义县| 沙河市| 剑川县| 南通市| 浑源县| 上思县| 靖西县| 崇左市| 阳谷县| 河南省| 逊克县| 任丘市| 滦平县| 保山市| 水城县| 临沂市| 日照市| 浑源县| 腾冲县| 许昌县| 扬中市| 和田县| 贵溪市|