F-testi

F-testi istatistik bilimi içinde bir sıra değişik problemlerde kullanılan parameterik çıkarımsal sınama yöntemidir. F-testi sıfır hipotezine göre gerçekte bir F-dağılımı gösteren sınama istatistiği bulunduğu kabul edilen hallerde, herhangi bir istatistiksel sınama yapma şeklidir. Bu çeşit bir istatistiksel sınama önce Ronald Fisher tarafından 1920'li yıllarda tek yönlü varyans analizi için ortaya atılıp kullanılmış ve sonradan diğer şekillerde F-dağılım kullanan sınamalar da ortaya atılınca, bu çeşit sınamalara genel isim olarak F-testi adı verilmesi Ronald Fisher anısına George W. Snecedor tarafından teklif edilip, istatistikçiler tarafından F-testi bir genel isim olarak kabul edilmiştir.

F-testinin en çok kullanıldığı sorunlar ve haller

F-testi birçok değişik parametrik çıkarımsal istatistik analizi için kullanılmaktadır. Ama elementer istatistiğe girişte fazla derin konulara girmeden f-testi şu değişik çıkarımsal analiz problem tiplerini incelemek için kullanılır:

. "İki anakütle için varyans eşitliği problemi": Normal dağılım gösterdiği kabul edilen iki anakütlenin varyanslarının oranının bire (1e) eşit olup olmadığının sınanması. Anakütle varyans oranı bir (1) ise, bu test istatistiği olur ve bunun F-dağılımı olduğu gösterilmiştir.^[1] Yani bu sınanma iki anakütlenin karşılaştırma problemlerinde iki anakütle varyans eşitliği sınamasıdır.

. "Çoklu karşılaştırma problemi": Tek yönlü varyans analizi probleminde bir normal dağılım gösteren kantitatif değişken ve bir de buna doğrusal ilişkili etki yapan kategorik değişken vardır. Fisher bu testi deneyim de kullandığı için etki yapan kategorik değikene sağlatım değişkeni ismini vermiştir.^[2] Kategorik sağlatım değişkeninin değişik kategori seviyeleri kantitatif değişken anakütlesini kategori gruplarına ayırır. Eğer kategorik değişkenin kantitatif değişkene doğrusal etkisi varsa, kategori grup ortalamaları değişiktir; yoksa yani kategori grup ortalamaları birbirine eşitse, kategorik değişkenin kantitatif değişkene etkisi yoktur. Tek bir anakütlenin içinde bulunan ikiden fazla kategorik grubun grup ortalamalarının hepsinin birbirine eşit olup olmadığı veya grup ortalamalarının birbirine eşitliği ve eşitsizliği, çoklu karşılaştırma olarak anılır ve F-testi ile sınanır.

. "Doğrusal regresayon katsayılar kestirimlerinin genel anlamlığı problemi": Doğrusal regresyon modelinin en-küçük-kareler yöntemi ile yapılan katsayılar kestirimlerinden sonra, bu kestirim katsayılarının sıfıra eşit olmadıkları (ve böylece birbirine eşit olup olmadıkları) "F-testi" ile sinanir. Eğer "F-testi" sonucu katsayıların sıfıra eşit olduğu hipotezi rededilemezse hesaplanan kestirim değerleri anlamsızdır. Böylece F-testi eldeki verileri kullanarak elde edilen doğrusal regresyon katasayılar kestiriminin anakütle doğrusal modeline genel olarak uyup uymadığını sınamak için kullanılır. Bu tip F-testi R² "çokluluk korelasyon katsayı"nın çok benzeridir.

İki anakütle varyansının eşitliği sınaması

X₁, ..., X_n n gözlemli bir örneklem verileri ve Y₁, ..., Y_m m gözlemli diğer bir örneklem verileri olsun ve bu iki örneklemin her birinin $N(\mu _{X},\sigma _{X}^{2})-$ ve $N(\mu _{Y},\sigma _{Y}^{2})-$ normal dağılım gösterdiği kabul edilsin.

Bu iki anakütlenin varyanslarının (yahut anakitle standart sapmalarının) birbirine eşit olup olmadığı incelenen problemdir.

İki örneklem için örneklem ortalamaları

{\overline {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}{\text{ ve }}{\overline {Y}}={\frac {1}{m}}\sum _{i=1}^{m}Y_{i}

ve örneklem varyansları

{\overline {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}{\text{ ve }}{\overline {Y}}={\frac {1}{m}}\sum _{i=1}^{m}Y_{i}

formülleri ile bulunur.

"F-testi" için sıfır hipotez

H₀ :

F=({\frac {sigma_{X}^{2}}{sigma_{Y}^{2}}})=1

veyahut varyanslar eşit olduğu varasayıldığı için

F={\frac {S_{X}^{2}}{S_{Y}^{2}}}

olur.

Bu halde sınama için birbirine eşit iki anakütlenin varyans eşitliği sıfır hipoteze uyan test-istatistiği F yani

F={\frac {S_{X}^{2}}{S_{Y}^{2}}}

(n-1) ve (m-1) serbestlik derecesi gösteren F-dağılımı gösterir.

Sınamayı yapmak için once F-değeri hesaplanır. Sonra

ya (n-1) ve (m-1) serbestlik decereli F-dağılımı için p-değeri bulunur ve bu 0,01 veya 0,05den küçükse H₀ rededilir.
ya da α=0,01 veya α=0,05 anlam düzeyinde (n-1) ve (m-1) serbestlik decereli F-dağılımı sınır değeri bulunur. Hesaplanan F-değeri bu sınır dışında ise H₀ rededilir.

F-testi iki örneklem verisinin de normal dağılım gösteren anakütlelerden gelmesi varsayımına dayanmaktadır. Eğer verilerin normal dağılımdan ayrıldığı bilinmekte ise, test istatistiğinin sağlamlığı (robustness) incelenmesi gerekir. Yapılan araştırmalarda F-istatistiğinin normalden ayrılma halinde sağlamlığının çok düşük olduğu bulunmuştur.^[3] Bu nedenle anakütle varyans eşitliği hipotezini sınayan daha yeni olarak ortaya çıkartılan Levene testi, Bartlett testi veya Bruce-Forsyth testinin kullanılması tavsiye edilmektedir.

Tek yönlü varyans analizi çoklu karşılaştırma problemi

Açıklama

Toplam sapmanın parçalarının karşılaştırılması için F-testi uygulanır. Tek yönlü veya tek faktörlü varyans analizi için istatistik anlamlılığın sınanması, F-test istatistiği olan şu

F={\dfrac {\mbox{grup ortalamalari varyansi}}{\mbox{grup-icindekiler varyansi ortalamasi}}}

F^{*}={\frac {\mbox{MSTR}}{\mbox{MSE}}}

burada:

{\mbox{MSTR}}={\frac {\mbox{SSTR}}{I-1}}

, I = sağlatımlar sayısı

{\mbox{MSE}}={\frac {\mbox{SSE}}{n_{T}-I}}

, n_T = toplam gözlem eleman sayısı

ifade ile I-1 ve n_T serbestlik derecelerinde F-dağılımı ifadesini karşılaştırmak suretiyle gerçekleştirilir.

Sayısal örnek

Doğrusal regresyon katsayı kestirimlerini genel olarak anlamlı olup olmaması sınaması

Diğer çeşit F-testleri

Dipnotlar

^ Eğer bir oran bire eşitse oranın pay ve paydası birbirine eşittir.
^ Bir sağlatım değişkeni için iki kategori tatbik edilme (ilac verilme) veya tatbik edilmeme (ilaç verilmeme) olmakta ve çoklu kategori halinde ise verilen değişik dozlar değişik kategoriler olmaktadır.
^ Markowski, Carol A (1990). "Conditions for the Effectiveness of a Preliminary Test of Variance". The American Statistician. 44 (4). ss. 322-326. doi:10.2307/2684360. 3 Mart 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 20 Mart 2010.

Ayrıca bakınız

F-dağılımı
Tek yönlü varyans analizi
Doğrusal regresyon

Dış bağlantılar

İngilizce Wikipedia "F-test" maddesi:[1] 13 Şubat 2010 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erisim:20.3.2010).
İngilizce Wikipedia "F-test of equality of variances" maddesi:[2] 4 Kasım 2015 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erisim:20.3.2010).
F-testi (İngilizce) (Erisim:20.3.2010).
F-dağılımı kullanarak online hipotez sınama 17 Şubat 2021 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erisim:20.3.2010).
F-testi için kritik değerler tablosu 17 Şubat 2021 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erisim:20.3.2010).

İstatistik

Betimsel istatistik

Sürekli veriler

Merkezî konum	Ortalama (Aritmetik, Geometrik, Harmonik) • Medyan • Mod
Yayılma	Açıklık • Standart sapma • Varyasyon katsayısı • Çeyrekler açıklığı • Kesirlilikler (kantil) (Dörttebirlik,Ondabirlik, Yüzdebirlik)
Dağılım şekli	Varyans • Çarpıklık • Basıklık • Moment (matematik)

İstatistiksel tablolar

Sıklık dağılımı • Çoklu sayılı özetleme tabloları • İlişki tablosu • Çoklu-yönlü sınıflandırma tabloları

İstatistiksel grafikler

Dairesel grafik • Çubuk grafiği • Kutu grafiği • Dal-yaprak grafikleri •Kontrol diyagramı • Histogram • Sıklık çizelgesi • Q-Q grafiği • Serpilme diyagramı

Veri toplama

Örnek tasarımı	Anakütle •Basit rassal örnekleme Örüntülü örnekleme • Tabakalı örnekleme • Küme örneklemesi • Çok aşamalı örnekleme •
Deneysel tasarım	Anakütle • İstatistiksel deneysel tasarım tipleri • Deneysel hata • Yineleme • Bloklama • Duyarlılık ve belirleme
Örneklem kavramları	Örneklem büyüklüğü • Sınama gücü • Etki büyüklüğü • Örnekleme dağılımı •Standart hata

Çıkarımsal istatistik
ve
İstatistiksel kestirim ve testler

Çıkarımsal analiz tipleri

Kestirim • Parametrik çıkarımsal analiz •Parametrik olmayan çıkarımsal analiz • Bayesci çıkarımsal analiz • Meta-analiz

Çıkarımsal kestirim

Genel kestirim kavramları	Momentler yöntemi • Enbüyük olabilirlik • Enbüyük artçıl • Bayes-tipi kestirimci • Minimum uzaklık • Maksimum aralık verme
Tekdeğişkenli kestirim	Kestirim • Güven aralığı • İnanılır aralık

Hipotez testi

İstatistiksel test ana kavramları	Sıfır hipotez • I.Tür ve II.Tür hata • Anlamlılık seviyesi •p-değeri
Basit tek-değişkenli ve iki-değişkenli parametrik hipotez testi	μ için testi • π için test • μ₁-μ₂ için test • π₁-π₂ için test • σ₁/σ₂ için test
Tek-değişkenli ve iki-değişkenli parametrik olmayan test analizi	Medyan testi • Ki-kare testi • Pearson ki-kare testi •Phi katsayısı • Wald testi • Mann-Whitney U testi • Wilcoxon'in işaretli sıralama testi

Korelasyon
ve
Regresyon analizi

Korelasyon	Pearson çarpım-moment korelasyonu • Sıralama korelasyonu ( Spearman'in rho • Kendall'in tau)
Doğrusal regresyon	Regresyon analizi • Doğrusal model • Genel doğrusal model • Genelleştirilmiş doğrusal model
Doğrusal olmayan regresyon	Parametrik olmayan • Yarıparametrik • Logistik
Varyans analizi	Tek-yönlü varyans analizi • Kovaryans analizi • Bloklu tek-yönlü varyans analizi • Etki karışımı değişkeni

Çokdeğişkenli istatistik

Çokdeğişkenli regresyon • temel bileşenler · Faktör analizi •Kanonik korelesyon • Uygunluk analizi • Kümeleme analizi

Zaman serileri analizi

Yapısal model tanımlanması	Zaman serisi yapisal model ögeleri • Zaman serisi ögeleri saptanması • Zaman grafiği • Korrelogram
Zaman serileri kestirim teknik ve modelleri	Dekompozisyon • Trend uygulama kestirimi • Üssel düzgünleştirme • ARIMA modelleri • Box–Jenkins • Spektral yoğunluk kestirimi
Kestirim değerlendirmesi	Zaman seri kestirim değerlendirmesi

Sağkalım analizi

Sağkalım fonksiyonu • Kaplan–Meier • Log-sıra testi • Başarısızlık oranı • orantılı tehlikeler modeli

Kategori • Outline • Endeks