Sınıflandırma Metrikleri


Karışıklık Matrisi Bir karışıklık matrisi, gerçek değerlerin bilinmekte olduğu bir dizi test verisi üzerinde, bir sınıflandırma modelinin performansını tanımlamak için sıklıkla kullanılan bir tablodur.  Örnek bir karışıklık matrisi aşağıda verilmiştir. Karışıklık matrisini anlamak kolaydır, ancak terminolojisi kafa karıştırıcı olabilir. İkili sınıflandırıcı için örnek bir karışıklık matrisiyle başlayalım ancak birden fazla sınıfın olması durumunda tablo kolayca genişletilebilir: İkili sınıflandırıcı için örnek karışıklık matrisi aşağıdaki gibi verilmiş … Okumaya devam et Sınıflandırma Metrikleri

Varyasyonel Otomatik Kodlayıcı (Variational Autoencoder)


Otomatik Kodlayıcılar hakkında daha fazla bilgi için tıklayınız. Varyasyonel Otomatik Kodlayıcı Nedir? Standart otomatik kodlayıcılar, kompakt gösterimleri oluşturmayı (veri sıkıştırma işlevini) ve girdileri iyi bir şekilde yeniden yapılandırmayı öğrenirler, gürültü giderici otomatik kodlayıcı gibi birkaç otomatik kodlayıcı dışında diğerleri uygulamada oldukça sınırlıdırlar. Otomatik kodlayıcıların üretim için temel sorunu, girdilerini, kodlanmış vektörlerin bulunduğu uzaya dönüştürdüğü gizli alanın (latent space) sürekli olmaması veya kolay enterpolasyona izin vermesidir. Ancak, üretici bir … Okumaya devam et Varyasyonel Otomatik Kodlayıcı (Variational Autoencoder)

Seyrek Otomatik Kodlayıcı (Sparse Autoencoder)


Otomatik Kodlayıcılar hakkında daha fazla bilgi için tıklayınız. Seyrek Otomatik Kodlayıcı Nedir? Otomatik kodlayıcının girdi verisini temsil eden yararlı özellikleri öğrenmesi için iki yoldan bahsetmiştik: kod boyutunu küçük tutmak (i.e. vanilla autoencoder) ve gürültü giderici otomatik kodlayıcılar. Üçüncü yöntem ise düzenli hale getirme (regularization) kullanıyor. Gürültü Giderici Otomatik Kodlayıcı (Denoising Autoencoder)  ile ilgili yazıda düzenlenmiş otomatik kodlayıcılardan bahsetmiştik. Düzenlenmiş otomatik kodlayıcıları hatırlayalım. Düzenlenmiş otomatik kodlayıcılar (regularized autoencoder) lineer olmayan (non-linear) … Okumaya devam et Seyrek Otomatik Kodlayıcı (Sparse Autoencoder)

Gürültü Giderici Otomatik Kodlayıcı (Denoising Autoencoder)


Otomatik Kodlayıcılar hakkında daha fazla bilgi için tıklayınız. Gürültü Giderici Otomatik Kodlayıcı Nedir? Gürültü giderici otomatik kodlayıcı, denoising autoencoder (DAE), girdi verilerinden anlamlı ve sağlam özellikler çıkarmak için eğitilen özel bir sinir ağıdır. Gürültü giderici otomatik kodlayıcı, overcomplete yapıdadır. Overcomplete otomatik kodlayıcıların, girdiden yararlı özellikleri çıkartabilmesi için bazı düzenlemeler yapılmalıdır. Bu tarz otomatik kodlayıcılara düzenlenmiş otomatik kodlayıcı (regularized autoencoder) denir. Düzenlenmiş otomatik kodlayıcılar lineer olmayan … Okumaya devam et Gürültü Giderici Otomatik Kodlayıcı (Denoising Autoencoder)

Otomatik Kodlayıcı (Autoencoder)


Otomatik Kodlayıcı Nedir? Otomatik kodlayıcı, girdi katmanındaki değerleri çıktı katmanına kopyalayan bir sinir ağıdır. Yani, sinir ağına girdi olarak verdiğimiz veriyi, çıktı katmanında tekrar oluştururuz. Otomatik kodlayıcı, veri setini eğitirken belirgin olarak (explicit) etiketlerin belirlenmediği bir denetimsiz öğrenme modelidir. Otomatik kodlayıcı, veriyi eğitirken kendi etiketlerini kendi ürettiği için öz-denetimli (self-supervised) bir öğrenme modeli olarak da geçer. Bu sinir ağı iki ayrı fazdan oluşmaktadır; kodlayıcı (encoder) … Okumaya devam et Otomatik Kodlayıcı (Autoencoder)

Takviyeli Öğrenme (Reinforcement Learning)


Şu ana kadar makine öğrenmesinde hep denetimli ve denetimsiz öğrenme yöntemleri ile ilgili paylaşımlarda bulunmuştuk. Artık Takviyeli Öğrenmeyi öğrenmenin vakti geldi! Takviyeli öğrenmeyi, denetimli ve denetimsiz öğrenme yolları hakkında bilgi sahibi olduktan sonra ve insan beynini taklit eden yapay sinir ağlarının yapısını bildikten sonra öğrenilmesi, Takviyeli Öğrenmenin amacına daha uygun olacaktır. Neden daha uygun olacağını şöyle açıklayabiliriz: Denetimli öğrenme ve denetimsiz öğrenme yöntemlerinden tamamen farklı … Okumaya devam et Takviyeli Öğrenme (Reinforcement Learning)

Doğru Metrik Seçimi


Makine Öğrenmesi alanında kullanabileceğimiz birçok metrikten bahsetmiştik. Bunlarla ilgili daha fazla bilgiye aşağıdan ulaşabilirsiniz. MSE, RMSE, MAE, MAPE ve Diğer Metrikler Çapraz Doğrulama (Cross Validation) Tahminlerin Kalitesini Ölçmek Kısaca bu metriklerin ne işe yaradığından bahsettikten sonra, bu metriklerin hangi problem için uygun olacağı üzerinde duracağız. Bir makine öğrenme algoritmasını verilerimize uyguladıktan sonraki adım, modelin  veriye ne kadar uygun olduğunu bulmaktır.  Farklı makine öğrenmesi algoritmalarını değerlendirmek … Okumaya devam et Doğru Metrik Seçimi

Log Kaybı ve Çapraz Entropi (Log Loss and Cross-Entropy)


Çapraz entropi kaybı veya log kaybı(log loss), çıktısı 0 ile 1 arasında bir olasılık değeri olan bir sınıflandırma modelinin performansını ölçer. Bu makine öğrenmesi modeline örnek olarak lojistik regresyon verilebilir. Tahmin edilen olasılık asıl değerden uzaklaştıkça çapraz entropi kaybı artar. Yani gerçek gözlem etiketi 1 olduğu zaman .012 olasılığının kötüye gideceği ve bunun yüksek bir kayıp değerine yol açacağı tahmin edilir. Mükemmel bir modelde, 0 … Okumaya devam et Log Kaybı ve Çapraz Entropi (Log Loss and Cross-Entropy)

Karar Ağaçları (Decision Trees)


Ağaç tabanlı öğrenme algoritmaları, en çok kullanılan ve denetimli öğrenme yöntemlerinden biri olarak düşünülmektedir. Ağaç tabanlı yöntemler, yüksek doğruluk, kararlılık ve yorumlanma kolaylığına sahiptir. Doğrusal modellerin aksine doğrusal olmayan ilişkileri de oldukça iyi eşleyebilirler. Sınıflandırma veya regresyon, elde edilen her türlü sorunun çözümünde uyarlanabilirler. Karar ağaçları, rastgele orman, gradyan güçlendirme gibi yöntemler, her türlü veri bilimi probleminde yaygın şekilde kullanılmaktadır Karar ağacı öğrenmesi, endüktif(inductive) çıkarım … Okumaya devam et Karar Ağaçları (Decision Trees)