Makine öğrenmesinde düşük performansının nedeni ya veriye aşırı uyumu ya da yetersiz uyumudur.

azuyum_cokuyum.png

Makine Öğrenmesinde Hedef Fonksiyona Benzetme

Denetimli makine öğrenmesi, en çok, girdi değişkenlerini (X) bir çıktı değişkenine (Y) eşleyen bir hedef fonksiyona (f) benzetmedir.

Y = f (X)

Bu karakterizasyon, sınıflandırma ve tahmin problemlerinin aralığı ve bunları ele almak için kullanılabilecek makine algoritmalarını tanımlar.

Eğitim verilerinden hedef fonksiyon öğrenmede önemli bir nokta, modelin yeni verileri ne kadar iyi genelleştirdiğidir. Genelleme önemlidir çünkü topladığımız veriler yalnızca bir örnektir, eksik ve gürültülü olabilir.

Makine Öğrenmesinde Genelleştirme

Makine öğrenmesinde, endüktif öğrenme olarak eğitim verilerinden hedef fonksiyonun öğrenilmesini tanımlıyoruz.

Endüktif öğrenme , denetimli makine öğrenme problemlerinin çözmeyi amaçladığı problem olan genel kavramları özel örneklerden öğrenmeyi ifade eder. Bu, diğer yollardan gelen indirgemeden farklıdır ve belirli kuralları genel kurallardan öğrenmeye çalışır.

Genelleştirme, bir makine öğrenme modeli tarafından öğrenilen kavramların öğrenme aşamasında model tarafından görülemeyen belirli örneklere ne kadar iyi uygulandığını ifade eder.

İyi bir makine öğrenmesi modelinin amacı, eğitim verilerinden problem alanındaki tüm verilere genelleme yapmaktır. Bu, modelin daha önce hiç görmediği veriler üzerinde gelecekte tahminler yapmamızı sağlar.

Aşırı uyumsuzluk ve yetersiz uyum, makine öğrenme algoritmalarının zayıf performansının en büyük iki nedendir.

İstatistiksel Uyum

İstatistikte, uyum, bir hedef fonksiyona ne kadar yakın olduğunuzu gösterir.

Makine öğrenmesinde kullanmak için iyi bir terminolojidir, çünkü denetimli makine öğrenmesi algoritmaları, girdi değişkenleri verilen çıktı değişkenleri için bilinmeyen temel haritalama fonksiyonunu(map) yaklaştırmaya çalışır.

İstatistikler sıklıkla, fonksiyonun yaklaşıklığının hedef fonksiyonla ne kadar iyi eşdeğer olduğunu tahmin etmek için kullanılan önlemleri belirten uygunluk iyiliğini tanımlar.

Bu yöntemlerden bazıları makine öğrenmesinde (ör. Artık hataların hesaplanması) yararlıdır, ancak bu tekniklerden bazıları, yakınımızda bulunduğumuz hedef fonksiyonun şeklini bildiklerini varsayar, bu da makine öğrenmesinde geçerli değildir.

Hedef fonksiyonun formunu bilseydik, onu gürültülü eğitim verilerinden alınan örneklerden öğrenmeye çalışmak yerine doğrudan tahmin yapmak için kullanırdık.

Makine Öğrenmesinde Aşırı Uyum

Aşırı uyum, eğitim verilerini çok iyi modelleyen bir modele ilişkindir.

Aşırı uyum, bir model, eğitim verilerindeki ayrıntı ve gürültüyü modelin yeni verilere olan performansını olumsuz etkileyen ölçüde öğrenirse olur. Bu, eğitim verilerindeki gürültüyü veya rasgele dalgalanmaları model tarafından ele geçirilir ve kavramlar olarak öğrenilir. Sorun şu ki bu kavramlar yeni verilere uygulanmıyor ve modellerin genelleme yeteneğini olumsuz yönde etkiliyor.

Aşırı uyum, bir hedef fonksiyonu öğrenirken daha fazla esnekliğe sahip olan parametrik olmayan ve doğrusal olmayan modellerle daha olasıdır. Bu nedenle, birçok parametrik olmayan makine öğrenme algoritmaları, modelin öğrendiği ayrıntıyı sınırlamak ve sınırlamak için parametreler veya teknikler de içerir.

Örneğin, karar ağaçları, çok esnek olan ve aşırı eğitim verilerine tabi olan parametrik olmayan bir makine öğrenme algoritmasıdır. Bu problem, bir ağacı öğrendikten sonra kesip çıkardığı detayların bir kısmını kaldırmak suretiyle çözülebilir.

cokuyum.png

 

 

Makine Öğrenmesinde Yetersiz Uyum

Yetersiz uyum, eğitim verilerini modelleyemeyen veya yeni verilere genellenemeyecek bir modele işaret eder.

Yetersiz bir makine öğrenme modeli uygun bir model değildir  ve eğitim verileri üzerinde düşük performans olacaktır.

İyi bir performans metriği göz önüne alındığında, tespit edilmesi kolay olduğu için sık sık yetersiz uyum tartışılmaz. Çare, devam etmek ve alternatif makine öğrenme algoritmaları denemektir. Bununla birlikte, aşırı uyumsuzluk sorunuyla iyi bir kontrast oluşturmaktadır.

azuyum.png

Makine Öğrenmesinde İyi Bir Uyum

İdeal olarak, tatmin edici noktada yetersiz uyumlu ve aşırı uyumlu modeller arasında seçim yapmak istiyorsunuz.

Amaç bu, ancak pratikte bunu yapmak zordur.

Bu hedefi anlamak için, bir eğitim verilerini öğrenirken zamanla bir makine öğrenme algoritmasının performansına bakabiliriz. Eğitim verilerindeki beceri ve eğitim sürecinden geri çektiğimiz bir test veri kümesindeki beceriyi planlayabiliriz.

Zamanla, algoritma öğrenirken, eğitim verisi üzerindeki model hatası düşer ve böylece test veri kümesindeki hata oluşur. Çok uzun süre eğitirsek, eğitim veri setindeki performans düşebilir; çünkü model aşırı uyumludur ve eğitim veri setinde alakasız detayları ve gürültüyü öğrenir. Aynı zamanda, test seti için hata, modelin genelleme yeteneği azaldığında yeniden yükselmeye başlar.

En iyi an, modelin hem eğitim veri setinde hem de görünmeyen test veri setinde iyi bir beceriye sahip olduğu test veri setindeki hata başlamadan hemen önceki noktadır.

Uygulamada uygun yer bulmanıza yardımcı olmak için kullanabileceğiniz iki ek teknik vardır: yeniden örnekleme yöntemleri ve doğrulama veri seti.

Aşırı Uyumu Nasıl Sınırlarız?

Hem gereğinden fazla uyum hem de yetersiz uyum model performansının düşük olmasına neden olabilir. Fakat şimdiye kadar uygulanan makine öğrenmesinde en yaygın olan sorun gereğinden fazla olan uyumluluktur.

Aşırı uyum sorundur çünkü eğitim verisinde makine öğrenme algoritmalarının değerlendirilmesi aslında en çok önem verdiğimiz değerlendirmeden, yani algoritmanın görünmeyen veriler üzerinde ne kadar iyi performans gösterdiğinden farklıdır.

Aşırı uyumu sınırlandırmak için makine öğrenme algoritmalarını değerlendirirken kullanabileceğiniz iki önemli teknik vardır:

  • Model doğruluğunu tahmin etmek için yeniden örnekleme tekniği kullanmak
  • Bir doğrulama veri kümesini geride tutmak

En popüler yeniden örnekleme tekniği, k-katlama çapraz doğrulama yöntemidir. Farklı küme altındaki eğitim verilerinizde modelinizi k-kez eğitmenize ve test etmenize ve görünmeyen veriler üzerinde bir makine öğrenmesi modeli performansının tahmini oluşturmayı sağlar.

Bir doğrulama veri kümesi, basitçe, makine öğrenmesi algoritmalarınızdan projenizin sonuna kadar tuttuğunuz eğitim verilerinizin bir alt kümesidir. Eğitim veri setinizde makine öğrenme algoritmalarınızı seçtikten ve ayarladıktan sonra, modellerin görünmeyen veriler üzerinde nasıl performans gösterebilecekleri konusunda nihai bir nesnel fikir elde etmek için öğrenilen modelleri doğrulama veri setinde değerlendirebilirsiniz.

Çapraz doğrulamayı kullanma, görünmeyen veriler üzerinde model doğruluğunu tahmin etmek için uygulanan makine öğrenmesinde altın bir standarttır. Verilere sahipseniz, bir doğrulama veri kümesi kullanmak da mükemmel bir uygulamadır.