Makine Öğrenmesi alanında kullanabileceğimiz birçok metrikten bahsetmiştik. Bunlarla ilgili daha fazla bilgiye aşağıdan ulaşabilirsiniz.
- MSE, RMSE, MAE, MAPE ve Diğer Metrikler
- Çapraz Doğrulama (Cross Validation)
- Tahminlerin Kalitesini Ölçmek
Kısaca bu metriklerin ne işe yaradığından bahsettikten sonra, bu metriklerin hangi problem için uygun olacağı üzerinde duracağız.
Bir makine öğrenme algoritmasını verilerimize uyguladıktan sonraki adım, modelin veriye ne kadar uygun olduğunu bulmaktır. Farklı makine öğrenmesi algoritmalarını değerlendirmek için farklı performans metrikleri kullanılmaktadır. Yani, elimizdeki veri kümesine bağlı olarak farklı algoritmaların verimliliğini ölçmek için farklı metrikler gereklidir.
Bir makine öğrenmesi modelinin performansını değerlendirirken bir sonraki önemli nokta model performansını değerlendirmek için hangi veri kümesinin kullanılması gerektiğidir. Makine öğrenmesi modeli, eğitim seti kullanılarak basitçe test edilemez, çünkü çıktılar önyargılı olabilir. Bu nedenle genelleme hatasını tahmin etmek için modelin henüz görmediği bir veri setini test etmesi gerekmektedir yani test veri setini. Bu nedenle, modelin test edilmesi amacıyla etiketli bir veri kümesi gerekir.
Regresyon için Performans Metrikleri
- Mean Absolute Error (MAE)
- Median Absolute Deviation (MAD)
- Root Mean Squared Error (RMSE)
- Mean Absolute Percentage Error (MAPE)
- Mean Percentage Error (MPE)
- Mean Squared Error (MSE)
- Normalised Mean Squared Error (NMSE)
- Symmetric Mean Absolute Percent Error (SMAPE)
- Mean Absolute Deviation Percent (MADP)
- Mean Absolute Scaled Error (MASE)
- Minimum Mean Square Error (MMSE)
- R Square
- Adjusted R Square
- Predicted REsidual Sums of
Squares (PRESS) - Generalised Cross Validation (GCV)
Sınıflandırma için Performans Metrikleri
- Precision – Recall
- Receiver operating characteristic curve (ROC)
- Area under curve (AUC)
- Accuracy
- Log Loss
- Confusion Matrix
- F-Scores
- Mean Consequential Error
- Mean Average Precision
- Multi Class Log Loss
- Hamming Loss
- Mean Utility
- Matthews Correlation Coefficient
Denetimsiz Modeller için Performans Metrikleri
- Rand Index
- Mutual Information
Diğer Performans Metrikleri
- CV Error
- Heuristic Methods to Find k
- Bilingual Evaluation Understudy (BLEU Score) (Doğal Dil İşleme için)