Scikit-Learn: K-Ortalama ve İris Veri Seti


İris – Süsen Çiçeği Örnek olarak kullanacagimiz veri seti yapay ögrenme alaninin en popüler veri setlerinden “Iris” veri seti. Iris veri seti 3 Iris bitki türüne (Iris setosa, Iris virginica and Iris versicolor) ait, her bir türden 50 örnek olmak üzere toplam 150 örnek sayisina sahip bir veri setidir. Her bir örnek için 4 özellik tanimlanmistir: taç yaprak uzunlugu, taç yaprak genisligi, çanak yaprak genisligi, çanak yaprak uzunluğu. … Okumaya devam et Scikit-Learn: K-Ortalama ve İris Veri Seti

K-Ortalama (K-Means)


Basit bir örnekle başlayalım. İki boyutlu düzlemde aşağıdaki gibi verilerimiz olsun. Bu verileri iki ayrı kümeye ayırmaya çalışalım. Rastgele iki tane küme merkezi belirleyelim.   Her bir noktayı en yakın küme merkeze yeniden atayalım.  Doğru bir atama yapamadık gibi gözüküyor. Küme merkezlerini yeniden hesaplayalım.   Hiçbir iyileştirme yapılamayana kadar son iki adımı tekrarlamalıyız. İki ardışık yinelemede iki küme arasında daha fazla veri noktası değiştirilmediğinde, açıkça … Okumaya devam et K-Ortalama (K-Means)

Kümeleme (Clustering)


Küme analizi veya kümeleme, bir grup nesneyi aynı gruba diğer gruplardaki olanlardan daha birbirlerine benzer şekilde gruplandırmaktır. Basitçe, amaç benzer özelliklere sahip grupları ayırmak ve onları kümelere atamaktır. Örneğin, bir tekstil şirketinin başındasınız ve işinizi büyütmek için müşterilerinizin tercihlerini anlamak istiyorsunuz. Her müşterinin ayrıntılarına bakmanız ve her biri için benzersiz bir iş stratejisi geliştirmeniz gerekiyor, ancak bu neredeyse imkansız. Yapabileceğiniz, tüm müşterilerinizi satın alma alışkanlıklarına … Okumaya devam et Kümeleme (Clustering)

Sorun Belirleme: Hangi Makine Öğrenmesi Algoritması Kullanılmalı


Makine öğrenmesi: Sorun Belirleme Genel olarak, bir öğrenme problemi n veri örneği setini inceler ve daha sonra bilinmeyen verilerin özelliklerini tahmin etmeye, öngörmeye çalışır. Eğitim Seti ve Test Seti Makine öğrenmesi, bir veri kümesinin bazı özelliklerini öğrenmek ve bunları yeni verilere uygulamakla ilgilidir. Bu yüzden bir algoritmayı değerlendirmek için makine öğrenmesindeki ortak uygulama, eldeki veriyi iki gruba ayırmaktır; Veri özelliklerini öğrendiğimiz eğitim setini ve bunları … Okumaya devam et Sorun Belirleme: Hangi Makine Öğrenmesi Algoritması Kullanılmalı

Denetimsiz Öğrenme (Unsupervised Learning)


Denetimsiz Öğrenme Denetimsiz öğrenme, verilerimizden elde etmek istediğimiz çıktının nasıl göründüğü hakkında çok az ya da hiç fikir sahibi olmadığımızda kullandığımız yaklaşımdır. Değişkenlerin etkisini bilmediğimiz veriden modeli oluşturabiliriz. “Denetimsiz öğrenmede” sadece veriler vardır onlar hakkında bilgi verilmez. Bu verilerden sonuçlar çıkarılmaya çalışılır. En baştan veriler hakkında herhangi bir bilgi verilmediği için çıkartılan sonuçların kesinlikle doğru olduğu söylenemez. Veriyi değişkenler arasındaki ilişkilere dayalı olarak kümeleyerek çeşitli … Okumaya devam et Denetimsiz Öğrenme (Unsupervised Learning)