İris – Süsen Çiçeği

irises

Örnek olarak kullanacagimiz veri seti yapay ögrenme alaninin en popüler veri setlerinden “Iris” veri seti. Iris veri seti 3 Iris bitki türüne (Iris setosaIris virginica and Iris versicolor) ait, her bir türden 50 örnek olmak üzere toplam 150 örnek sayisina sahip bir veri setidir. Her bir örnek için 4 özellik tanimlanmistir: taç yaprak uzunlugu, taç yaprak genisligi, çanak yaprak genisligi, çanak yaprak uzunluğu. Yani veri setimizde, her bir bitki örnegi ayri bir gözlemi (örnegi) ifade ederken; bitki tür ismi bagimli degisken, bitkilerin ölçülen 4 temel özelligi ise bagimsiz degiskenleri ifade eder.

Biz sadece bitkilere ait ilk iki temel özelliği kullanacağız. Programın tamamı aşağıdadır.


from sklearn.cluster import KMeans
from sklearn import datasets

import matplotlib.pyplot as plt

# iris veri setini yukleyelim
iris = datasets.load_iris()
X, y = iris.data, iris.target
print X[:,1]

# 3 ayri merkez ile kumele islemi
k_means = KMeans(n_clusters=3, random_state=0)
k_means.fit(X)
y_pred = k_means.predict(X)

# dagilim grafigi
plt.scatter(X[:, 0], X[:, 1], c=y_pred,cmap='Dark2')
plt.show()

kmeans2.png