Veri Nesneleri ve Öznitelik Çeşitleri


Veri Nesneleri ve Öznitelik Çeşitleri

Veri setleri, genelde vektörler ile ifade edilebilen veri nesnelerinden oluşmaktadır. Veri nesnelerini ise öznitelikler oluşturur. Veri nesneleri eğer bir veri tabanında saklanabiliyorsa, veritabanının satırları veri nesnelerine ve sütunlar da özniteliklere karşılık gelir. Bir öznitelik, veri nesnesinin bir özelliğini, niteliğini temsil eden bir veri alanıdır..Veri madenciliğinde özniteliklere değişken veya nitelik, veri ambarında özniteliklere boyut denirken makine öğrenmesinde verinin her özniteliğine bir özellik demeyi, istatistikçiler de değişken demeyi tercih eder.

Sürekli ve Ayrık Öznitelikler

\noindent Ayrık bir öznitelik, sınırlı veya sayılabilir bir şekilde sonsuz değerler dizisine sahip tamsayı olarak temsil edilebilen veya edilemeyen niteliktir. Bir kişinin hasta olup olmaması (sağlıklı, hasta) veya bir kıyafetin bedeni (small, medium, large) birer ayrık özniteliktir. Ayrık öznitelikler birer sayı ile de (sağlıklı 0, hasta 1 gibi) ifade edilebilirler. Ayrık özniteliğin olası değerler kümesi sonsuz olabilir ancak değerler gerçek sayılar ile birebir eşleşmektedir; örneğin bir okuldaki öğrenci sayısı sonsuz değer alabilir ancak yine de sayılabilir. Bir öznitelik ayrık değilse süreklidir. Sürekli öznitelikler tanımlanmış ayrı değerlerle sınırlı değildir ancak sürekli bir aralıktaki herhangi bir değeri içerebilir. Herhangi iki sürekli değer arasında sonsuz sayıda başka değer olabilir bu nedenle çoğu zaman sürekli öznitelikler kayan noktalı sayılar ile gösterilebilir. Özetle, ayrık öznitelikler bir zarın atılmasında gelebilecek sayılar gibi (1, 2, … , 6) sadece belirli değerler alabilirken, sürekli öznitelikler bir kişinin boyu gibi (159, 160, 161.5, …) belirli aralıktaki tüm değerleri alabilir.

Sayısal Öznitelik

Sayısal öznitelik nicel bir veridir. Yani, bir tamsayı veya gerçek değerlerle temsil edilebilen ölçülebilir bir miktardır. Sayısal öznitelikler aralık ölçekli veya oran ölçekli öznitelikler olarak ikiye ayrılır.

Aralık Ölçekli Öznitelik

Aralık ölçekli öznitelik, eşit boyuttaki birimler ölçeğinde değerlere sahiptir. Aralık ölçekli özniteliklerin değerleri bir düzene sahiptir ve pozitif veya negatif değerlere sahip olabilirler. Dolayısıyla, değerlerin bir sıralamasının sağlamanın yanı sıra bu öznitelik, değerler arasındaki farkı karşılaştırmayı ve ölçmeyi de sağlar. Bir aralık ölçekli öznitelikte, tüm nicel öznitelikler ölçülebilir. Sıcaklık bir aralık ölçekli özniteliktir, günün herhangi bir anında havanın sıcaklığı ölçülebilir ve birbiri ile karşılaştırılabilinir ancak gerçek bir sıfır değeri olmadığı için aralık ölçekli özniteliklerden bahsederken oran kullanılmaz. Örneğin, öğlen ölçülen 20°C’nin gece ölçülen 10°C’den, 10°C daha fazla sıcak olduğu söylenirken, iki kat daha sıcak olduğu söylenemez. Aralık ölçekli öznitelikler sayısal öznitelikler olduğu için ortalama almak veya medyan hesaplamak gibi işlemler yapılabilir.

Oran Ölçekli Öznitelik

Oran ölçekli öznitelik, doğal bir sıfır noktasına sahip sayısal bir özniteliktir. Başka bir deyişle, bir öznitelik oran ölçekli ise bir değerden başka bir değerin çarpımı (veya oranı) olarak bahsedebiliriz. Bunlara ek olarak oran ölçekli öznitelik bir sayısal öznitelik olduğu için değerler sıralanabilir, değerlerin ortalamasının veya medyanının hesaplanması da mümkündür. İstatistiksel olarak, oran ölçekli özniteliklerde geometrik veya harmonik ortalama hesaplanabilir. Oran ölçekli öznitelik aralık ölçekli özniteliklerin sahip olduğu tüm özelliklere sahiptir ve ek olarak mutlak bir sıfır veya orijin karakterine sahiptir. Örneğin, bir kişinin boyu ve kilosu sıfır olamaz veya sıfırın altında olamaz ya da bir kitaptaki kelime sayısı veya gelir miktarı da birer oran ölçekli özniteliktir; negatif bir gelir veya kelime sayısı yoktur.

Kategorik Öznitelik

Kategorik öznitelikler isimle ilgili demek olan nominal öznitelikler olarak da bilinir. Kategorik bir özniteliğin değerleri, semboller veya bir şeylerin adlarıdır. Her değer bir tür kategoriyi, kodu veya durumu temsil eder. Bu kategorik değerlerin anlamlı bir sıralaması yoktur ve buna bilgisayar biliminde enumerations denir. Örneğin, nominal bir öznitelik olarak bir kişinin sağlıklı olup olmamasını ele alırsak ya sağlıklıdır ya da hastadır, bu sağlıklı ve hasta olma durumunu temsil eden isimleri birer sembol olarak sayılarla da ifade edebiliriz ancak 0 sağlıklı, 1 hasta olma durumundaki sayılar birer nicelik ifade etmemektedir. Kategorik öznitelikler sayı olarak değerler alsalar da birer sayısal öznitelik değildir yani bu kategorik değerlerin sayısal değerlerde olduğu gibi ortalamasının alınması veya sıralanması mantıklı birer işlem olmayacaktır. Ek olarak, değerler sıralanır ve ayrıca değerler, ortalama, medyan ve mod arasındaki farkı da hesaplayabiliriz.

İkili Öznitelik

İkili öznitelik sadece iki kategorisi bulunan kategorik niteliklerdir. Genelde 0 verilen o özniteliğin eksikliğini ve 1 de varlığını temsil etmektedir. Kategorilerden biri doğruya diğeri yanlışa karşılık geliyorsa, bu ikili nitelikler Boolean olarak adlandırılır. Kedi veya köpek olarak sınıflandırma yaparken ya da cinsiyetin kadın veya erkek olarak temsil edildiği durumlarda olduğu gibi her iki özniteliğin de aynı derecede önemli olduğu ikili özniteliklere simetrik ikili öznitelik denir. Bir özniteliğin diğeri ile aynı önem derecesine sahip olmadığı durumlarda, örneğin bir kişinin kanser olması veya olmaması durumunda olduğu gibi özniteliklere ise asimetrik ikili öznitelik denir.

Sıralı Öznitelik

Sıralı öznitelik, aralarında anlamlı bir sıra veya sıralama bulunan olası değerlere sahip bir niteliktir ancak art arda gelen değerler arasındaki büyüklük bilinmemektedir. Kıyafetlerin bedeni, small, medium, large gibi öznitelikler ile ifade edilebilmektedir ancak bu değerler, small olanın medium olandan ne kadar küçük olduğu hakkında bir bilgi sağlamaz. Sıralı öznitelikler, değer aralığının sınırlı sayıda sıralı kategoriye bölünmesiyle sayısal büyüklüklerin ayrıklaştırılmasından da elde edilebilir. Sıralı öznitelik nitel birer veridir. Yani, gerçek bir boyut veya miktar vermeden bir nesnenin özelliğini açıklar. Böyle nitel değerler genel olarak kategorileri temsil eden kelimeler ile ifade edilir ve bu kategorileri birer sayı ile ifade etmek de mümkündür, small 0, medium 1 ve large 2 gibi.

Cartoon vector created by vectorjuice – www.freepik.com

Bir Cevap Yazın

Aşağıya bilgilerinizi girin veya oturum açmak için bir simgeye tıklayın:

WordPress.com Logosu

WordPress.com hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Twitter resmi

Twitter hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Facebook fotoğrafı

Facebook hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Connecting to %s