T-testi

T-testi, iki grubu karşılaştırmak ve aralarındaki farkı ölçmek istediğimizde kullanılır. Örneğin:

  • Bir ülkenin insanlarının bir başka ülkenin insanlarından daha kilolu olup olmadığını karşılaştırmak istedigimizde
  • Diğer yemeklere oranla tatlı yemenin insan vücudundaki hormon salınımlarına etkisini karşılaştırmak istediğimizde

T-testleri, hipotez testleri içerisinde en sık kullanılan testlerdir. T-testi, iki veri grubuna ait ortalamalar arasında belirgin bir fark olup olmadığını istatistiksel olarak belirlemeye çalışan bir yaklaşımdır. Başka bir deyişle, bu farklılıkların tesadüfen olup olmadığını bilmenizi sağlar. T-testi parametrik bir testtir.

T testi kabaca üçe ayrılır: Tek örneklem için t testi, bağımsız örneklem için t testi ve bağımlı örneklem için t testi

Tek örneklem t-testi

Tek örneklem t-testi, nicel (sayısal) bir veri örneğinin, başka bir veri setinden (popülasyondan) önemli ölçüde farklı olup olmadığını belirlemek için kullanılan istatistiksel bir testtir.

Tek örneklem t-testinin kullanılabilmesi için veri setinin bazı gereksinimleri karşılaması gerekir. Bu varsayımlar şu şekildedir:

  • Test değişkeninin sürekli bir değişken olması,
  • Gözlemlerin birbirinden bağımsız olması,
  • Popülasyondan seçilen örneklemlerin rastgele olması,
  • Test değişkeninin yaklaşık olarak normal dağılıma sahip olması,
  • Hem örneklemin hem de popülasyonun yaklaşık olarak eşit varyansa sahip olması ve
  • Test değişkeninin herhangi bir aykırı değer içermemesi gerekir.

Normal olmayan popülasyon dağılımları, özellikle kalın kuyruklu veya çok çarpık olanlar, testin gücünü önemli ölçüde azaltır.

Tek örneklem t-testinin boş hipotezi (H_0 ) ve alternatif hipotezi (H_1 ) şu şekilde ifade edilebilir:

  • H_0 : \mu = \overline{x} (“popülasyon ortalaması örneklem ortalamasına eşittir”)
  • H_1 : \mu\overline{x} (“popülasyon ortalaması örneklem ortalamasına eşit değildir”)

Tek örneklem t-testinin gerçekleştirilebilmesi için önce örneklemin ortalamasının ve standart sapmasının hesaplanması gerekir. Daha sonra t-test istatistiği yani t-puanı aşağıdaki gibi hesaplanır.

\overline{x} = örneklem ortalaması
\mu = popülasyon ortalaması
std = örneklemin standart sapması
n = örneklem büyüklüğü

T \text{-} puani = t = \frac{\overline{x}-\mu } {std / \sqrt{n}}

Hesaplanan t puanı daha sonra df = n – 1 serbestlik derecesi ve seçilen güven aralığı ile t dağılım tablosundan kritik t puanı ile karşılaştırılır. Hesaplanan t puanı > kritik t puanı ise, sıfır hipotezini reddederiz.

Örneğin, bir okuldaki öğrencilere zeka testi yapılıyor ve test ortalaması 100 bulunuyor. Yeni geliştirilen bir öğrenme yöntemi öğrenciler üzerinde uygulanıyor. Öğrencilerden 41’i rastgele olarak seçiliyor ve zeka testi tekrar yapılıyor. Bu 41 kişilik örneklem üzerinde zeka testinin ortalaması 130 ve standart sapması 25 olarak bulunuyor. Her iki test arasındaki farkın şans eseri mi olduğu yoksa yeni ögrenme yönteminin işe yarayıp yaramadığını anlamak istiyoruz. Bunun için tek örneklem t testi uyguluyoruz. Hipotezler ve alfa değeri şu şekildedir:

H_0 : \overline{x} = 100
H_1 : \overline{x} > 100
\alpha = 0.05 (anlamlılık seviyesinin belirlenmesi için)
Serbestlik derecesi: 41-1= 40

\overline{x} = örneklem ortalaması = 130
\mu = popülasyon ortalaması = 100
std = örneklemin standart sapması = 25
n =örneklem büyüklüğü = 41

T \text{-} puani = t = \frac{130-100 } {25 / \sqrt{41}}
T \text{-} puani = 7.6837

40 serbestlik derecesi için 0,05 düzeyinde kritik değerin ne olduğunu bulabilmek için T tablosuna bakalım.

\text{Kritik deger}: 1.684 < \text{T-puani}: 7.6837

Bulduğumuz t-puanı tablodaki değerden yüksek olduğu için H_0 hipotezi reddedilir. Sonuç olarak örneklemin ortalamasının popülasyon ortalamasından farklı olduğunu belirtebiliriz.

Bağımsız örneklem t-testi

Bağımsız örneklem t testi (Student t-test), iki bağımsız popülasyonun birbirinden önemli ölçüde farklı olduğuna dair istatistiksel kanıt olup olmadığını belirlemek için popülasyonların ortalamalarını karşılaştırır.

Bağımsız örneklem t testi yalnızca iki grubun ortalamalarını karşılaştırabilir. İkiden fazla grup arasında karşılaştırma yapamaz. Ikiden fazla grubun ortalamalarını karşılaştırmak isterseniz, muhtemelen ANOVA çalıştırmanız gerekecektir.

Bağımsız örneklem t testi için verilerin aşağıdaki gereksinimleri karşılamalıdır:

  • Sürekli olan bir bağımlı değişkenin olması,
  • Kategorik olan bir bağımsız değişkenin olması (yani, iki veya daha fazla grup),
  • Hem bağımlı hem de bağımsız değişkenler üzerinde değerleri olan durumların olması,
  • Bağımsız örneklemlerin / grupların olması:
    • Her örneklemdeki denekler arasında bir ilişki yoktur. Bu şu demek:
      • Birinci gruptaki denekler ikinci grupta da olamaz,
      • Her iki gruptaki hiçbir denek diğer gruptaki denekleri etkileyemez,
      • Hiçbir grup diğer grubu etkileyemez
  • Popülasyondan seçilen örneklemlerin rastgele olması,
  • Her grup için bağımlı değişkenin yaklaşık olarak normal dağılıma sahip olması,
  • Varyansların homojenliği (yani, gruplar arasında yaklaşık olarak eşit varyansların olması),
  • Aykırı değerlerin olmaması gerekir.

Bağımsız örneklem t testi için bir veya daha fazla varsayım karşılanmadığında, bunun yerine parametrik olmayan Mann-Whitney U testini çalıştırabilirsiniz.

Bağımsız örneklem t testinin boş hipotezi (H0) ve alternatif hipotezi (H1) iki farklı ancak eşdeğer şekilde ifade edilebilir:

  • H_0 : µ1 = µ2 (“iki popülasyon ortalaması eşittir”)
  • H_1 : µ1 ≠ µ2 (“iki popülasyon ortalaması eşit değildir”)

veya

  • H_0 : µ1 – µ2 = 0 (“iki popülasyon ortalaması arasındaki fark 0’a eşittir”)
  • H_1 : µ1 – µ2 ≠ 0 (“iki popülasyon ortalaması arasındaki fark 0’a eşit değildir”)

Levene’nin Varyans Eşitliği Testi

Bağımsız örneklem t testinin varyans homojenliği varsayımını gerektirir. Yani, her iki grup da aynı varyansa sahip olmalıdır.

Levene’nin testi için hipotezler şunlardır:

Business vector created by stories – www.freepik.com