F-testi

F-testi istatistik bilimi içinde bir sıra değişik problemlerde kullanılan parameterik çıkarımsal sınama yöntemidir. F-testi sıfır hipotezine göre gerçekte bir F-dağılımı gösteren sınama istatistiği bulunduğu kabul edilen hallerde, herhangi bir istatistiksel sınama yapma şeklidir. Bu çeşit bir istatistiksel sınama önce Ronald Fisher tarafından 1920'li yıllarda tek yönlü varyans analizi için ortaya atılıp kullanılmış ve sonradan diğer şekillerde F-dağılım kullanan sınamalar da ortaya atılınca, bu çeşit sınamalara genel isim olarak F-testi adı verilmesi Ronald Fisher anısına George W. Snecedor tarafından teklif edilip, istatistikçiler tarafından F-testi bir genel isim olarak kabul edilmiştir.

F-testinin en çok kullanıldığı sorunlar ve haller

F-testi birçok değişik parametrik çıkarımsal istatistik analizi için kullanılmaktadır. Ama elementer istatistiğe girişte fazla derin konulara girmeden f-testi şu değişik çıkarımsal analiz problem tiplerini incelemek için kullanılır:

  1. . "İki anakütle için varyans eşitliği problemi": Normal dağılım gösterdiği kabul edilen iki anakütlenin varyanslarının oranının bire (1e) eşit olup olmadığının sınanması. Anakütle varyans oranı bir (1) ise, bu test istatistiği olur ve bunun F-dağılımı olduğu gösterilmiştir.[1] Yani bu sınanma iki anakütlenin karşılaştırma problemlerinde iki anakütle varyans eşitliği sınamasıdır.
  1. . "Çoklu karşılaştırma problemi": Tek yönlü varyans analizi probleminde bir normal dağılım gösteren kantitatif değişken ve bir de buna doğrusal ilişkili etki yapan kategorik değişken vardır. Fisher bu testi deneyim de kullandığı için etki yapan kategorik değikene sağlatım değişkeni ismini vermiştir.[2] Kategorik sağlatım değişkeninin değişik kategori seviyeleri kantitatif değişken anakütlesini kategori gruplarına ayırır. Eğer kategorik değişkenin kantitatif değişkene doğrusal etkisi varsa, kategori grup ortalamaları değişiktir; yoksa yani kategori grup ortalamaları birbirine eşitse, kategorik değişkenin kantitatif değişkene etkisi yoktur. Tek bir anakütlenin içinde bulunan ikiden fazla kategorik grubun grup ortalamalarının hepsinin birbirine eşit olup olmadığı veya grup ortalamalarının birbirine eşitliği ve eşitsizliği, çoklu karşılaştırma olarak anılır ve F-testi ile sınanır.
  1. . "Doğrusal regresayon katsayılar kestirimlerinin genel anlamlığı problemi": Doğrusal regresyon modelinin en-küçük-kareler yöntemi ile yapılan katsayılar kestirimlerinden sonra, bu kestirim katsayılarının sıfıra eşit olmadıkları (ve böylece birbirine eşit olup olmadıkları) "F-testi" ile sinanir. Eğer "F-testi" sonucu katsayıların sıfıra eşit olduğu hipotezi rededilemezse hesaplanan kestirim değerleri anlamsızdır. Böylece F-testi eldeki verileri kullanarak elde edilen doğrusal regresyon katasayılar kestiriminin anakütle doğrusal modeline genel olarak uyup uymadığını sınamak için kullanılır. Bu tip F-testi R2 "çokluluk korelasyon katsayı"nın çok benzeridir.

İki anakütle varyansının eşitliği sınaması

X1, ..., Xn n gözlemli bir örneklem verileri ve Y1, ..., Ym m gözlemli diğer bir örneklem verileri olsun ve bu iki örneklemin her birinin N ( μ X , σ X 2 ) {\displaystyle N(\mu _{X},\sigma _{X}^{2})-} ve N ( μ Y , σ Y 2 ) {\displaystyle N(\mu _{Y},\sigma _{Y}^{2})-} normal dağılım gösterdiği kabul edilsin.

Bu iki anakütlenin varyanslarının (yahut anakitle standart sapmalarının) birbirine eşit olup olmadığı incelenen problemdir.

İki örneklem için örneklem ortalamaları

X ¯ = 1 n i = 1 n X i  ve  Y ¯ = 1 m i = 1 m Y i {\displaystyle {\overline {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}{\text{ ve }}{\overline {Y}}={\frac {1}{m}}\sum _{i=1}^{m}Y_{i}}

ve örneklem varyansları

X ¯ = 1 n i = 1 n X i  ve  Y ¯ = 1 m i = 1 m Y i {\displaystyle {\overline {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}{\text{ ve }}{\overline {Y}}={\frac {1}{m}}\sum _{i=1}^{m}Y_{i}}

formülleri ile bulunur.

"F-testi" için sıfır hipotez

H0 : F = ( s i g m a X 2 s i g m a Y 2 ) = 1 {\displaystyle F=({\frac {sigma_{X}^{2}}{sigma_{Y}^{2}}})=1} veyahut varyanslar eşit olduğu varasayıldığı için F = S X 2 S Y 2 {\displaystyle F={\frac {S_{X}^{2}}{S_{Y}^{2}}}} olur.


Bu halde sınama için birbirine eşit iki anakütlenin varyans eşitliği sıfır hipoteze uyan test-istatistiği F yani

F = S X 2 S Y 2 {\displaystyle F={\frac {S_{X}^{2}}{S_{Y}^{2}}}}

(n-1) ve (m-1) serbestlik derecesi gösteren F-dağılımı gösterir.

Sınamayı yapmak için once F-değeri hesaplanır. Sonra

  • ya (n-1) ve (m-1) serbestlik decereli F-dağılımı için p-değeri bulunur ve bu 0,01 veya 0,05den küçükse H0 rededilir.
  • ya da α=0,01 veya α=0,05 anlam düzeyinde (n-1) ve (m-1) serbestlik decereli F-dağılımı sınır değeri bulunur. Hesaplanan F-değeri bu sınır dışında ise H0 rededilir.

F-testi iki örneklem verisinin de normal dağılım gösteren anakütlelerden gelmesi varsayımına dayanmaktadır. Eğer verilerin normal dağılımdan ayrıldığı bilinmekte ise, test istatistiğinin sağlamlığı (robustness) incelenmesi gerekir. Yapılan araştırmalarda F-istatistiğinin normalden ayrılma halinde sağlamlığının çok düşük olduğu bulunmuştur.[3] Bu nedenle anakütle varyans eşitliği hipotezini sınayan daha yeni olarak ortaya çıkartılan Levene testi, Bartlett testi veya Bruce-Forsyth testinin kullanılması tavsiye edilmektedir.

Tek yönlü varyans analizi çoklu karşılaştırma problemi

Açıklama

Toplam sapmanın parçalarının karşılaştırılması için F-testi uygulanır. Tek yönlü veya tek faktörlü varyans analizi için istatistik anlamlılığın sınanması, F-test istatistiği olan şu

F = grup ortalamalari varyansi grup-icindekiler varyansi ortalamasi {\displaystyle F={\dfrac {\mbox{grup ortalamalari varyansi}}{\mbox{grup-icindekiler varyansi ortalamasi}}}}
F = MSTR MSE {\displaystyle F^{*}={\frac {\mbox{MSTR}}{\mbox{MSE}}}}
burada:
MSTR = SSTR I 1 {\displaystyle {\mbox{MSTR}}={\frac {\mbox{SSTR}}{I-1}}} , I = sağlatımlar sayısı
ve
MSE = SSE n T I {\displaystyle {\mbox{MSE}}={\frac {\mbox{SSE}}{n_{T}-I}}} , nT = toplam gözlem eleman sayısı

ifade ile I-1 ve nT serbestlik derecelerinde F-dağılımı ifadesini karşılaştırmak suretiyle gerçekleştirilir.

Sayısal örnek

Doğrusal regresyon katsayı kestirimlerini genel olarak anlamlı olup olmaması sınaması

Diğer çeşit F-testleri

Dipnotlar

  1. ^ Eğer bir oran bire eşitse oranın pay ve paydası birbirine eşittir.
  2. ^ Bir sağlatım değişkeni için iki kategori tatbik edilme (ilac verilme) veya tatbik edilmeme (ilaç verilmeme) olmakta ve çoklu kategori halinde ise verilen değişik dozlar değişik kategoriler olmaktadır.
  3. ^ Markowski, Carol A (1990). "Conditions for the Effectiveness of a Preliminary Test of Variance". The American Statistician. 44 (4). ss. 322-326. doi:10.2307/2684360. 3 Mart 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 20 Mart 2010. 

Ayrıca bakınız

Dış bağlantılar

  • İngilizce Wikipedia "F-test" maddesi:[1] 13 Şubat 2010 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erisim:20.3.2010).
  • İngilizce Wikipedia "F-test of equality of variances" maddesi:[2] 4 Kasım 2015 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erisim:20.3.2010).
  • F-testi (İngilizce) (Erisim:20.3.2010).
  • F-dağılımı kullanarak online hipotez sınama 17 Şubat 2021 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erisim:20.3.2010).
  • F-testi için kritik değerler tablosu 17 Şubat 2021 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erisim:20.3.2010).
  • g
  • t
  • d
İstatistik
Betimsel istatistik
Sürekli veriler
Merkezî konum
Yayılma
Dağılım şekli
Varyans • Çarpıklık • Basıklık • Moment (matematik)
İstatistiksel tablolar
Sıklık dağılımı  • Çoklu sayılı özetleme tabloları  • İlişki tablosu  • Çoklu-yönlü sınıflandırma tabloları
İstatistiksel grafikler
Dairesel grafik • Çubuk grafiği • Kutu grafiği • Dal-yaprak grafikleri •Kontrol diyagramı • Histogram • Sıklık çizelgesi • Q-Q grafiği • Serpilme diyagramı
Veri toplama
Örnek tasarımı
Deneysel tasarım
Anakütle • İstatistiksel deneysel tasarım tipleri  • Deneysel hata  • Yineleme • Bloklama • Duyarlılık ve belirleme
Örneklem kavramları
Örneklem büyüklüğü • Sınama gücü  • Etki büyüklüğü • Örnekleme dağılımı •Standart hata
Çıkarımsal istatistik
ve
İstatistiksel kestirim ve testler
Çıkarımsal analiz tipleri
Kestirim  • Parametrik çıkarımsal analiz  •Parametrik olmayan çıkarımsal analiz  • Bayesci çıkarımsal analiz  • Meta-analiz
Çıkarımsal kestirim
Genel kestirim kavramları
Momentler yöntemi • Enbüyük olabilirlik • Enbüyük artçıl  • Bayes-tipi kestirimci • Minimum uzaklık • Maksimum aralık verme
Tekdeğişkenli kestirim
Kestirim  • Güven aralığı  • İnanılır aralık
Hipotez testi
İstatistiksel test ana kavramları
Sıfır hipotez  • I.Tür ve II.Tür hata  • Anlamlılık seviyesi  •p-değeri
Basit tek-değişkenli ve iki-değişkenli
parametrik hipotez testi
μ için testi •

π için test • μ12 için test • π12 için test  •

σ12 için test
Tek-değişkenli ve iki-değişkenli
parametrik olmayan test analizi
Medyan testi  • Ki-kare testi • Pearson ki-kare testi •Phi katsayısı  • Wald testi • Mann-Whitney U testi • Wilcoxon'in işaretli sıralama testi
Korelasyon
ve
Regresyon analizi
Korelasyon
Doğrusal regresyon
Regresyon analizi  • Doğrusal model • Genel doğrusal model • Genelleştirilmiş doğrusal model
Doğrusal olmayan regresyon
Parametrik olmayan • Yarıparametrik • Logistik
Varyans analizi
Tek-yönlü varyans analizi • Kovaryans analizi • Bloklu tek-yönlü varyans analizi • Etki karışımı değişkeni
Çokdeğişkenli istatistik
Çokdeğişkenli regresyon • temel bileşenler · Faktör analizi  •Kanonik korelesyon  • Uygunluk analizi  • Kümeleme analizi
Zaman serileri analizi
Yapısal model tanımlanması
Zaman serisi yapisal model ögeleri  • Zaman serisi ögeleri saptanması  • Zaman grafiği • Korrelogram
Zaman serileri kestirim teknik ve modelleri
Dekompozisyon • Trend uygulama kestirimi  • Üssel düzgünleştirme  • ARIMA modelleri  • Box–Jenkins  • Spektral yoğunluk kestirimi
Kestirim değerlendirmesi
Zaman seri kestirim değerlendirmesi
Sağkalım analizi
Sağkalım fonksiyonu • Kaplan–Meier • Log-sıra testi • Başarısızlık oranı • orantılı tehlikeler modeli
Kategori • Outline • Endeks