Veri Dağılımının Şekli

Veri kümesinin dağılımı görselleştirildiğinde, yalnızca bir tepeye sahip ise tek modlu dağılım, iki tepeye sahip ise iki modlu dağılım olarak adlandırılır. Tek modlu dağılımda, eğer bu tepe, grafiğin tam ortasında meydana gelirse, bu çan şeklindeki bir dağılımdır. Eğer grafiğin sağ ve sol yarısı birbirinin aynada yansımış hali gibi ise de bu dağılıma simetrik denir. Çan şeklindeki bir normal dağılım en bilinen simetrik dağılımdır.

Çarpıklık ve Basıklık

Tek modlu ve mükemmel bir simetrik dağılıma sahip bir olasılık eğrisinde, verilerin ortalaması, medyanı ve modu, hepsi aynı merkez değerindedir. Gerçek dünya verilerinde çoğu zaman dağılımlar simetrik değildir. Veri kümesinin modunun medyandan daha küçük bir değere sahip olduğu durumlarda dağılım pozitif çarpık, mod değeri medyandan büyük olduğu durumlarda ise dağılım negatif çarpıktır. Çarpıklık bilgisi, veri kümesinin ortalama değer çevresinde en çok hangi tarafa doğru yoğunlaştığını gösterir. Çarpıklık kavramına benzer şekilde basıklık da olasılık dağılımının şeklinin bir tanımlayıcısıdır. Basıklık, verilerin dağılımının basık veya sivri olması ile ilgilidir.

Business vector created by vectorjuice – www.freepik.com