K-Ortalama (K-Means)


Basit bir örnekle başlayalım. İki boyutlu düzlemde aşağıdaki gibi verilerimiz olsun. Bu verileri iki ayrı kümeye ayırmaya çalışalım. Rastgele iki tane küme merkezi belirleyelim.   Her bir noktayı en yakın küme merkeze yeniden atayalım.  Doğru bir atama yapamadık gibi gözüküyor. Küme merkezlerini yeniden hesaplayalım.   Hiçbir iyileştirme yapılamayana kadar son iki adımı tekrarlamalıyız. İki ardışık yinelemede iki küme arasında daha fazla veri noktası değiştirilmediğinde, açıkça … Okumaya devam et K-Ortalama (K-Means)

Kümeleme (Clustering)


Küme analizi veya kümeleme, bir grup nesneyi aynı gruba diğer gruplardaki olanlardan daha birbirlerine benzer şekilde gruplandırmaktır. Basitçe, amaç benzer özelliklere sahip grupları ayırmak ve onları kümelere atamaktır. Örneğin, bir tekstil şirketinin başındasınız ve işinizi büyütmek için müşterilerinizin tercihlerini anlamak istiyorsunuz. Her müşterinin ayrıntılarına bakmanız ve her biri için benzersiz bir iş stratejisi geliştirmeniz gerekiyor, ancak bu neredeyse imkansız. Yapabileceğiniz, tüm müşterilerinizi satın alma alışkanlıklarına … Okumaya devam et Kümeleme (Clustering)

K-En Yakın Komşu (K-Nearest Neighbors(KNN))


KNN, Denetimli Öğrenmede sınıflandırma ve regresyon için kullanılan algoritmalardan biridir. En basit makine öğrenmesi algoritması olarak kabul edilir. Diğer Denetimli Öğrenme algoritmalarının aksine, eğitim aşamasına sahip değildir. Eğitim ve test hemen hemen aynı şeydir. Tembel bir öğrenme türüdür. Bu nedenle, kNN, geniş veri setini işlemek için gereken algoritma olarak ideal bir aday değildir. KNN ile temelde yeni noktaya en yakın noktalar aranır. K, bilinmeyen noktanın … Okumaya devam et K-En Yakın Komşu (K-Nearest Neighbors(KNN))

Destek Vektör Makineleri (Support Vector Machine)


Makine öğrenmesinde , destek vektör makineleri (SVM’ler  vektörel ağları destekler), sınıflandırma ve regresyon analizi için kullanılan veriyi analiz eden ilişkili öğrenme algoritmalarıyla denetimli öğrenme modelleridir. Her biri, her iki kategoriden birine ya da diğerine ait olarak işaretlenmiş bir dizi eğitim örneği verildiğinde, bir SVM eğitim algoritması, bir olasılık dışı ikili doğrusal sınıflandırıcı haline getirerek bir kategoriye ya da diğerine yeni örnekler atayan bir model oluşturur … Okumaya devam et Destek Vektör Makineleri (Support Vector Machine)

Scikit-Learn: Lojistik Regresyon ve Iris Veri Seti


İris – Süsen Çiçeği Örnek olarak kullanacagimiz veri seti yapay ögrenme alaninin en popüler veri setlerinden “Iris” veri seti. Iris veri seti 3 Iris bitki türüne (Iris setosa, Iris virginica and Iris versicolor) ait, her bir türden 50 örnek olmak üzere toplam 150 örnek sayisina sahip bir veri setidir. Her bir örnek için 4 özellik tanimlanmistir: taç yaprak uzunlugu, taç yaprak genisligi, çanak yaprak genisligi, çanak yaprak uzunluğu. … Okumaya devam et Scikit-Learn: Lojistik Regresyon ve Iris Veri Seti

Lojistik Regresyon (Logistic Regression)


Lojistik regresyon, bağımlı değişkenin kategorik bir değişken olduğu regresyon problemi gibidir. Doğrusal sınıflandırma problemlerinde yaygın bir biçimde kullanılır. Regresyon denilmesine rağmen burada bir sınıflandırma söz konusudur. Lojistik regresyon, bir sonucu belirleyen bir veya daha fazla bağımsız değişken bulunan bir veri kümesini analiz etmek için kullanılan istatistiksel bir yöntemdir. Sonuç, ikili bir değişkenle ölçülür (yalnızca iki olası sonuç vardır). Lojistik regresyonda, bağımlı değişken ikili veya ikili, … Okumaya devam et Lojistik Regresyon (Logistic Regression)