Naive Bayes Sınıflandırıcısı (Naive Bayes Classifier)


Naïve Bayes Sınıflandırıcı adını İngiliz matematikçi Thomas Bayes’ten (yak. 1701 – 7 Nisan 1761) alır. Naïve Bayes Sınıflandırıcı Örüntü tanıma problemine ilk bakışta oldukça kısıtlayıcı görülen bir önerme ile kullanılabilen olasılıkcı bir yaklaşımdır. Bu önerme örüntü tanıma da kullanılacak her bir tanımlayıcı öznitelik ya da parametrenin istatistik açıdan bağımsız olması gerekliliğidir. Her ne kadar bu önerme Naive Bayes sınıflandırıcının kullanım alanını kısıtlasa da, genelde istatistik … Okumaya devam et Naive Bayes Sınıflandırıcısı (Naive Bayes Classifier)

Destek Vektör Makineleri (Support Vector Machine)


Makine öğrenmesinde , destek vektör makineleri (SVM’ler  vektörel ağları destekler), sınıflandırma ve regresyon analizi için kullanılan veriyi analiz eden ilişkili öğrenme algoritmalarıyla denetimli öğrenme modelleridir. Her biri, her iki kategoriden birine ya da diğerine ait olarak işaretlenmiş bir dizi eğitim örneği verildiğinde, bir SVM eğitim algoritması, bir olasılık dışı ikili doğrusal sınıflandırıcı haline getirerek bir kategoriye ya da diğerine yeni örnekler atayan bir model oluşturur … Okumaya devam et Destek Vektör Makineleri (Support Vector Machine)

Sorun Belirleme: Hangi Makine Öğrenmesi Algoritması Kullanılmalı


Makine öğrenmesi: Sorun Belirleme Genel olarak, bir öğrenme problemi n veri örneği setini inceler ve daha sonra bilinmeyen verilerin özelliklerini tahmin etmeye, öngörmeye çalışır. Eğitim Seti ve Test Seti Makine öğrenmesi, bir veri kümesinin bazı özelliklerini öğrenmek ve bunları yeni verilere uygulamakla ilgilidir. Bu yüzden bir algoritmayı değerlendirmek için makine öğrenmesindeki ortak uygulama, eldeki veriyi iki gruba ayırmaktır; Veri özelliklerini öğrendiğimiz eğitim setini ve bunları … Okumaya devam et Sorun Belirleme: Hangi Makine Öğrenmesi Algoritması Kullanılmalı

Scikit-Learn: Lojistik Regresyon ve Iris Veri Seti


İris – Süsen Çiçeği Örnek olarak kullanacagimiz veri seti yapay ögrenme alaninin en popüler veri setlerinden “Iris” veri seti. Iris veri seti 3 Iris bitki türüne (Iris setosa, Iris virginica and Iris versicolor) ait, her bir türden 50 örnek olmak üzere toplam 150 örnek sayisina sahip bir veri setidir. Her bir örnek için 4 özellik tanimlanmistir: taç yaprak uzunlugu, taç yaprak genisligi, çanak yaprak genisligi, çanak yaprak uzunluğu. … Okumaya devam et Scikit-Learn: Lojistik Regresyon ve Iris Veri Seti

Olasılıksal Dereceli Azalma (Stochastic Gra­di­ent Descent (SGD)


Stochastic Gradient Descent (SGD), (lineer) Destek Vektör Makineleri ve Lojistik Regresyon gibi konveks kayıp fonksiyonları altında lineer sınıflandırıcıların ayırt edici öğreniminde basit ama çok etkili bir yaklaşımdır. SGD, makine öğrenmesi alanında uzun zamandır var olsa da, son zamanlarda büyük ölçekli öğrenme bağlamında dikkat çekmektedir. SGD, metin sınıflandırmasında ve doğal dil işlemede sıklıkla karşılaşılan büyük ölçekli ve seyreltilmiş makine öğrenmesi problemlerine başarıyla uygulanmıştır. Verilerin seyrek olduğu … Okumaya devam et Olasılıksal Dereceli Azalma (Stochastic Gra­di­ent Descent (SGD)

Scikit-Learn: Theil-Sen ve Sıradan En Küçük Kareler Tahminci Karşılaştırması


Theil-SenRegressor Tahmincisi ile Sıradan En Küçük Kareler Tahmincisini zaman ve uçdeğerlerin(aykırı verilerin) varlığında numunelere (örneklerimize) nasıl uyduğunu (fit ettiğini) karşılaştıracağız. Önce gerekli paketleri import edelim. Tahmincilerimizi ve plot da yer alacak bilgileri ayarlıyoruz. Aykırı Verileri, kullanacagımız rastgele veri setimizi ayarlıyoruz. Sonrasında örneklerimizi plot’a yerleştiriyoruz. Her iki tahminciyi gerçekleştirip, plot’a ekliyoruz. Aynı işlemi aynı veri seti üzerine, x yönü üzerine aykırı veriler ekleyerek tekrar tahmincilerin en … Okumaya devam et Scikit-Learn: Theil-Sen ve Sıradan En Küçük Kareler Tahminci Karşılaştırması

Theil-SenRegressor: Genelleştirilmiş Medyan Tabanlı Tahminci


TheilSenRegressor tahmincisi medyanın birden çok boyutta genellemesinde kullanır. Bu nedenle, çok değişkenli aykırı değerler için sağlamdır. Bununla birlikte, kestiricinin sağlamlığı problemin boyutsallığı ile birlikte hızla azalır. Sağlamlık özelliklerini kaybeder ve yüksek boyutta olağan bir en küçük kareden daha iyi olmaz. TheilSenRegressor asimtotik etkinlik açısından ve tarafsız bir tahmin edici olarak Sıradan En Küçük Karelerle (OLS) karşılaştırılabilir. Theil-Sen, OLS’nin aksine, verilerin altında yatan dağılımı hakkında bir … Okumaya devam et Theil-SenRegressor: Genelleştirilmiş Medyan Tabanlı Tahminci

ROC Eğrisi (ROC Curve)


ROC eğrisi ve eksiksiz bir hassasiyet / özgüllük raporu oluşturmayı sağlar. ROC eğrisinde, gerçek pozitif oran (Hassasiyet), bir parametrenin farklı kesme noktaları için yanlış pozitif oranı (100-Özgüllük) işlevinde çizilir. ROC eğrisindeki her nokta belirli bir karar eşiğine karşılık gelen bir duyarlılık / özgüllük çifti temsil eder. ROC eğrisi altındaki alan (AUC), bir parametrenin iki  grubun ne kadar iyi ayırt edilebildiğinin bir ölçüsüdür. Örneğin iki ayrı … Okumaya devam et ROC Eğrisi (ROC Curve)

Lojistik Regresyon (Logistic Regression)


Lojistik regresyon, bağımlı değişkenin kategorik bir değişken olduğu regresyon problemi gibidir. Doğrusal sınıflandırma problemlerinde yaygın bir biçimde kullanılır. Regresyon denilmesine rağmen burada bir sınıflandırma söz konusudur. Lojistik regresyon, bir sonucu belirleyen bir veya daha fazla bağımsız değişken bulunan bir veri kümesini analiz etmek için kullanılan istatistiksel bir yöntemdir. Sonuç, ikili bir değişkenle ölçülür (yalnızca iki olası sonuç vardır). Lojistik regresyonda, bağımlı değişken ikili veya ikili, … Okumaya devam et Lojistik Regresyon (Logistic Regression)

Sınıflandırma (Classification)


Sınıflandırmada, bir veri kümesi (data set) birbirinden farklı ve önceden belirlenmiş sınıflardan birine atanmasıdır. Sınıflandırma algoritmaları, verilen eğitim kümesinden hangi veriyi hangi sınıfa atayacağını öğrenir.  Daha sonra test verilerini doğru sınıflara atamaya çalışır. Verilerin sınıflarını belirten değerlere etiket (label) denir. Sınıflandırma aslında doğrusal bir fonksiyon değildir. Sınıflandırma problemine, y’nin kesikli olduğu gerçeğini göz ardı ederek yaklaşabiliriz ve x değerini tahmin etmeye çalışmak için doğrusal regresyon … Okumaya devam et Sınıflandırma (Classification)