Öznitelik Vektörü

Öznitelik vektörleri (özellik vektörleri), gerçek dünyada ele alınamayacak kadar karmaşık olabilen verilerin makinelerin anlayabileceği bir şekilde basitleşirilmiş bir halidir. Emlak sektörünü ele alalım; emlakçılar, birbirinden farklı birçok evi kiraya vermeye ve satmaya çalışıyorlar. Pazarlamaya çalıştıkları evler, gerçek dünyada müşterilerine tarif ettiklerinden çok daha fazla özelliğe sahiptir ancak bir evi tanımlayabilmek için yeteri sayıda bilgi içeren bir özellik kümesi kullanıyorlar. Evleri anlatırken evin konumundan, apartman mı müstakil mi olduğundan, kaçıncı katta bulunduğundan, kaç katlı olduğundan, kaç metrekare olduğundan, odalarının sayısından, büyüklüğünden, nasıl ısındığından, fiyatından ve evin buna benzer özelliklerinden bahsediyorlar. Evin, tarif edilen özelliklerine baktığımızda ise bu kelimelerin sadece soyut birer kavram olduğunu görüyoruz ancak bize ev hakkında yeteri kadar bilgi sağlamaya yetiyor. Kısaca, öznitelik vektörleri gerçek hayat verilerinin birer özetidir diyebiliriz.

Büyüklük, oda sayısı, salon sayısı ve bina yaşı bilgilerini kullanarak satılık evler için öznitelik vektörleri oluşturduğumuzda, satılık evler veri setimiz aşağıdaki tablodaki gibi gözükecektir.

Makine öğrenmesi algoritmalarını öğrenme ve öğrendiklerinden çıkarım yapma olarak iki aşama halinde ele alabiliriz. Öğrenme aşamasının amacı, öznitelik vektörü olarak adlandırılan verileri tanımlamak ve bir model halinde özetleyebilmektir. Bir öznitelik vektörü, verilerin pratik bir basitleştirmesidir. Bunu gerçek dünyadaki nesnelerin yeterli bir özeti olan nitelikler listesi gibi düşünebilirsiniz. Makinelerin öğrenme ve çıkarım yapma adımları doğrudan veri yerine öznitelik vektörüne dayanmaktadır. Makine öğrenmesi modelleri ham verinin sayısal bir gösterimi olan öznitelik vektörlerini birer girdi olarak alır. Makine öğrenmesi algoritmalarının öğrenme sürecini doğru bir şekilde tamamlayabilmesi için öznitelik vektörünün veriyi temsil etmesi ve yeterli olması gerekmektedir. Makine öğrenmesi algoritmalarının çalışmasını sağlayan öznitelikler oluşturmak için, verilerin, alan bilgisinin kullanılarak yaratılması sürecine öznitelik mühendisliği denir. Öznitelik mühendisliği süreçleri ileriki bölümlerde daha detaylı ele alınmıştır.

Infographic vector created by stories – www.freepik.com