Scikit-Learn: K-Ortalama ve İris Veri Seti


İris – Süsen Çiçeği

irises

Örnek olarak kullanacagimiz veri seti yapay ögrenme alaninin en popüler veri setlerinden “Iris” veri seti. Iris veri seti 3 Iris bitki türüne (Iris setosaIris virginica and Iris versicolor) ait, her bir türden 50 örnek olmak üzere toplam 150 örnek sayisina sahip bir veri setidir. Her bir örnek için 4 özellik tanimlanmistir: taç yaprak uzunlugu, taç yaprak genisligi, çanak yaprak genisligi, çanak yaprak uzunluğu. Yani veri setimizde, her bir bitki örnegi ayri bir gözlemi (örnegi) ifade ederken; bitki tür ismi bagimli degisken, bitkilerin ölçülen 4 temel özelligi ise bagimsiz degiskenleri ifade eder.

Biz sadece bitkilere ait ilk iki temel özelliği kullanacağız. Programın tamamı aşağıdadır.


from sklearn.cluster import KMeans
from sklearn import datasets

import matplotlib.pyplot as plt

# iris veri setini yukleyelim
iris = datasets.load_iris()
X, y = iris.data, iris.target
print X[:,1]

# 3 ayri merkez ile kumele islemi
k_means = KMeans(n_clusters=3, random_state=0)
k_means.fit(X)
y_pred = k_means.predict(X)

# dagilim grafigi
plt.scatter(X[:, 0], X[:, 1], c=y_pred,cmap='Dark2')
plt.show()

kmeans2.png

 

Bir Cevap Yazın

Aşağıya bilgilerinizi girin veya oturum açmak için bir simgeye tıklayın:

WordPress.com Logosu

WordPress.com hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Twitter resmi

Twitter hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Facebook fotoğrafı

Facebook hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Connecting to %s