Scikit-Learn: K-Ortalama ve İris Veri Seti


İris – Süsen Çiçeği Örnek olarak kullanacagimiz veri seti yapay ögrenme alaninin en popüler veri setlerinden “Iris” veri seti. Iris veri seti 3 Iris bitki türüne (Iris setosa, Iris virginica and Iris versicolor) ait, her bir türden 50 örnek olmak üzere toplam 150 örnek sayisina sahip bir veri setidir. Her bir örnek için 4 özellik tanimlanmistir: taç yaprak uzunlugu, taç yaprak genisligi, çanak yaprak genisligi, çanak yaprak uzunluğu. … Okumaya devam et Scikit-Learn: K-Ortalama ve İris Veri Seti

TensorFlow: Lineer Regresyon


Başlamadan öne TensorFlow’a Kolay Bir Başlangıç’a bakılması tavsiye edilir. TensorFlow hakkında daha detaylı bilgi için TensorFlow 101‘e bakınız. Basit Lineer Regresyon  Problem: Mahallelerin güvenli olup olmadığı ile ilgili başlıca iki kavram vardır. Hırsızlık ve yangın. Güvenlik şirketleri evlerinizi sigortalarken bu iki tehlikeli durumu göz önüne almaktadır. Peki hırsızlık oranı ile yangınların arasında bir bağlantı var mıdır? Yani diğer bir anlamda X yangınların sayısı olsun, Y … Okumaya devam et TensorFlow: Lineer Regresyon

Sorun Belirleme: Hangi Makine Öğrenmesi Algoritması Kullanılmalı


Makine öğrenmesi: Sorun Belirleme Genel olarak, bir öğrenme problemi n veri örneği setini inceler ve daha sonra bilinmeyen verilerin özelliklerini tahmin etmeye, öngörmeye çalışır. Eğitim Seti ve Test Seti Makine öğrenmesi, bir veri kümesinin bazı özelliklerini öğrenmek ve bunları yeni verilere uygulamakla ilgilidir. Bu yüzden bir algoritmayı değerlendirmek için makine öğrenmesindeki ortak uygulama, eldeki veriyi iki gruba ayırmaktır; Veri özelliklerini öğrendiğimiz eğitim setini ve bunları … Okumaya devam et Sorun Belirleme: Hangi Makine Öğrenmesi Algoritması Kullanılmalı

Scikit-Learn: Lojistik Regresyon ve Iris Veri Seti


İris – Süsen Çiçeği Örnek olarak kullanacagimiz veri seti yapay ögrenme alaninin en popüler veri setlerinden “Iris” veri seti. Iris veri seti 3 Iris bitki türüne (Iris setosa, Iris virginica and Iris versicolor) ait, her bir türden 50 örnek olmak üzere toplam 150 örnek sayisina sahip bir veri setidir. Her bir örnek için 4 özellik tanimlanmistir: taç yaprak uzunlugu, taç yaprak genisligi, çanak yaprak genisligi, çanak yaprak uzunluğu. … Okumaya devam et Scikit-Learn: Lojistik Regresyon ve Iris Veri Seti

Scikit-Learn: Theil-Sen ve Sıradan En Küçük Kareler Tahminci Karşılaştırması


Theil-SenRegressor Tahmincisi ile Sıradan En Küçük Kareler Tahmincisini zaman ve uçdeğerlerin(aykırı verilerin) varlığında numunelere (örneklerimize) nasıl uyduğunu (fit ettiğini) karşılaştıracağız. Önce gerekli paketleri import edelim. Tahmincilerimizi ve plot da yer alacak bilgileri ayarlıyoruz. Aykırı Verileri, kullanacagımız rastgele veri setimizi ayarlıyoruz. Sonrasında örneklerimizi plot’a yerleştiriyoruz. Her iki tahminciyi gerçekleştirip, plot’a ekliyoruz. Aynı işlemi aynı veri seti üzerine, x yönü üzerine aykırı veriler ekleyerek tekrar tahmincilerin en … Okumaya devam et Scikit-Learn: Theil-Sen ve Sıradan En Küçük Kareler Tahminci Karşılaştırması

Tahminlerin Kalitesini Ölçmek


Bir makine öğrenmesi algoritmasını uyguladıktan sonra bir sonraki adım, veri kümelerine dayanan modelin ne kadar etkili olduğunu bulmaktır. Farklı Makine Öğrenmesi Algoritmalarını değerlendirmek için farklı performans metrikleri kullanılır. Örneğin, farklı nesnelerin görüntüleri arasında ayrım yapmak için kullanılan bir sınıflandırıcı; Log-Loss, Average Accuracy, AUC, vb. Gibi sınıflandırma performans metriklerini kullanabiliriz. Makine öğrenme modeli bir hisse senedi fiyatını tahmin etmeye çalışıyorsa, RMSE verimliliğini hesaplamak için kullanılabilir. Makine öğrenme … Okumaya devam et Tahminlerin Kalitesini Ölçmek

Doğruluk Ölçümü (Accuracy Measure)


  Doğruluk (Accuracy): Bir fiziksel özelliğin ölçümü ile özelliğin gerçek değeri arasındaki farktır. Kesinlik veya Hassasiyet (Precision): Bir ölçme aletinin aynı bir fiziksel büyüklüğe ait tekrarlanan çeşitli ölçümler esnasında aynı değeri verebilme özelliğidir. Doğruluk, Hassasiyet, Hata Nedir? Doğruluk Ölçümü Bir sınıflandırıcının doğruluğu herhangi bir grupta ölçülebilir: eğitim, değerlendirme ve test. Bu setlerden herhangi biri Z olsun ve Z’deki örneklerin sayısı da N olsun. Acc (doğruluk), sınıfların Z … Okumaya devam et Doğruluk Ölçümü (Accuracy Measure)

Doğruluk, Hassasiyet, Hata (Accuracy, Precision, Error)


Hassasiyet, tekrarlanabilirliği ifade ederken,  doğruluk ölçülen değerin gerçek değere ne kadar yakın olduğunu gösterir. Doğruluk ve Kesinlik(Hassasiyet) Doğruluk, bir ölçümün o ölçüm için doğru değere ne kadar yakın olduğudır. Bir ölçüm sisteminin hassasiyeti, tekrarlanan ölçümler arasında ölçümlerin birbirine ne kadar yakın olduğunu ifade eder (aynı koşullar altında tekrarlanma). Ölçümler hem doğru hem kesin, doğru ama kesin değil, kesin ama doğru değil, ya da hiçbiri olmayabilir … Okumaya devam et Doğruluk, Hassasiyet, Hata (Accuracy, Precision, Error)

Yetersiz Uyum ve Aşırı Uyum (Underfitting And Overfitting)


Makine öğrenmesinde düşük performansının nedeni ya veriye aşırı uyumu ya da yetersiz uyumudur. Makine Öğrenmesinde Hedef Fonksiyona Benzetme Denetimli makine öğrenmesi, en çok, girdi değişkenlerini (X) bir çıktı değişkenine (Y) eşleyen bir hedef fonksiyona (f) benzetmedir. Y = f (X) Bu karakterizasyon, sınıflandırma ve tahmin problemlerinin aralığı ve bunları ele almak için kullanılabilecek makine algoritmalarını tanımlar. Eğitim verilerinden hedef fonksiyon öğrenmede önemli bir nokta, modelin … Okumaya devam et Yetersiz Uyum ve Aşırı Uyum (Underfitting And Overfitting)