Hata payı

Her biri %95 güven aralığına (aşağıda), hata payına (solda) ve örnek boyutuna (sağda) sahip farklı boyutlardaki anketlerin renklerle kodlanmış olasılık yoğunlukları. Her aralık, 2. çeyreklik verildiğinde, %95 güvenle gerçek değerlerin bulunabileceği aralığı yansıtır. Hata payı, güven aralığının yarısıdır (ayrıca aralığın yarıçapı). Örnek ne kadar büyükse, hata payı o kadar küçük olur. Ayrıca, örnek raporlanan 2. çeyreklikten ne kadar uzaksa, hata payı da o kadar küçük olur.

Hata marjı ya da hata payı bir anketin sonuçlarındaki rastgele örnekleme hatası miktarını ifade eden bir istatistiktir. Hata payı ne kadar büyükse, anket sonucunun yığın özelliklerini yansıtacağına duyulan güven o kadar az olmalıdır. Bir popülasyon eksik örneklenip çıktı ölçüsü pozitif varyansa sahip olduğunda, yani ölçü değiştiğinde, hata marjı pozitif olur.

Hata marjı terimi genellikle anket dışı bağlamlarda ölçülen miktarların raporlanmasında oluşan gözlemsel hatayı belirtmek için kullanılır. Aynı zamanda konuşma dilinde, bir hedefe ulaşmada sahip olabileceğiniz alan veya esneklik miktarına atıfta bulunmak için de kullanılmaktadır. Örneğin, sporda genellikle yorumcular tarafından bir hedef, puan veya sonuca ulaşmak için ne kadar hassasiyetin gerekli olduğunu açıklarken kullanılır. Bowlingte kullanılan pinler 4,75 inç genişliğinde, top ise 8,5 inç genişliğindedir, bu nedenle bir bowling sporcusunun ikinci atışta kalan belirli bir pini düşürmek için 21,75 inç hata payı olduğu söylenebilir (örnek olarak 1 veya 5 numaralı pinler gösterilebilir, 7 ve 10 numaralı pinler hat kenarında olduklarından aynı hata marjına sahip değildir).

Konsept

Basit bir evet / hayır anketini ele alalım P {\displaystyle P} , N {\displaystyle N} ile ifade edilen bir popülasyondan çekilen n {\displaystyle n} adet katılımcının cevaplarının örneği ( n << N ) {\displaystyle (n<<N)} ve p {\displaystyle p} verdikleri evet cevaplarının yüzdesi olsun. p {\displaystyle p} sonucunun tüm N {\displaystyle N} popülasyonuna uygulanacak bir anketin gerçek sonucuna, bu anketi gerçekten uygulamak zorunda kalmadan ne kadar yakın çıktığını bilmek isteriz. Varsayımsal olarak, N {\displaystyle N} popülasyonundan yeni çekilen sonraki n {\displaystyle n} adet katılımcının cevaplarının p 1 , p 2 , {\displaystyle p_{1},p_{2},\ldots } , p ¯ {\displaystyle {\overline {p}}} üzerinde normal dağılmasını bekleriz. Hata payı, bu sonuçların belirli bir yüzdesinin p ¯ {\displaystyle {\overline {p}}} den farkına ilişkin beklenilen mesafeyi tanımlar.

68-95-99.7 kuralına göre p 1 , p 2 , {\displaystyle p_{1},p_{2},\ldots } sonuçlarının %95'inin gerçek ortalamanın p ¯ {\displaystyle {\overline {p}}} her iki tarafında yaklaşık iki standart sapma ( ± 2 σ P {\displaystyle \pm 2\sigma _{P}} ) aralığına düşmesini bekleriz. Bu aralığa güven aralığı adı verilir ve yarıçap (aralığın yarısı), %95 güven düzeyine karşılık gelen hata payı olarak adlandırılır.

Genellikle γ {\displaystyle \gamma } güven düzeyinde, n {\displaystyle n} örnek boyutuna sahip bir popülasyonun beklenen standart sapması σ {\displaystyle \sigma } ; z γ {\displaystyle z_{\gamma }} çeyreklik açıklığını (ayrıca, bir z-skorunu) ve σ 2 n {\displaystyle {\sqrt {\frac {\sigma ^{2}}{n}}}} standart hatayı gösterirken

M O E γ = z γ × σ 2 n {\displaystyle MOE_{\gamma }=z_{\gamma }\times {\sqrt {\frac {\sigma ^{2}}{n}}}}

hata payına sahiptir.

Standart sapma ve standart hata

Normal dağılan  p 1 , p 2 , {\displaystyle p_{1},p_{2},\ldots } değerlerinin n {\displaystyle n} ile değişen bir standart sapmaya sahip olmasını bekleriz. Daha küçük n {\displaystyle n} , daha geniş hata payı anlamına gelir. Buna standart hata denir σ p ¯ {\displaystyle \sigma _{\overline {p}}} .

Anket sonuçlarından biri için şu varsayılır: p = p ¯ {\displaystyle p={\overline {p}}} ve sonraki tüm sonuçlar p 1 , p 2 , {\displaystyle p_{1},p_{2},\ldots } birlikte bir varyansa sahiptir σ P 2 = P ( 1 P ) {\displaystyle \sigma _{P}^{2}=P(1-P)} .

Standart hata = σ p ¯ σ P 2 n p ( 1 p ) n {\displaystyle {\text{Standart hata}}=\sigma _{\overline {p}}\approx {\sqrt {\frac {\sigma _{P}^{2}}{n}}}\approx {\sqrt {\frac {p(1-p)}{n}}}}

p ( 1 p ) {\displaystyle p(1-p)} bir Bernoulli dağılımının varyansına karşılık gelir.

Farklı güven seviyelerinde maksimum hata payı

γ {\displaystyle \gamma } güven düzeyi için ortalama ile ilgili bir güven aralığı μ ± z γ σ {\displaystyle \mu \pm z_{\gamma }\sigma } , yani [ μ z γ σ , μ + z γ σ ] {\displaystyle [\mu -z_{\gamma }\sigma ,\mu +z_{\gamma }\sigma ]} şeklindedir. P {\displaystyle P} değerleri γ {\displaystyle \gamma } olasılıkla bu aralık içine düşmelidir. z γ {\displaystyle z_{\gamma }} 'nin kesin değerleri normal dağılımın çeyrekler açıklığı fonksiyonu ile verilir (ve 68-95-99.7 kuralına yakınsar).

z γ {\displaystyle z_{\gamma }} , | γ | 1 {\displaystyle |\gamma |\geq 1} için tanımsızdır, yani, z 1.00 {\displaystyle z_{1.00}} gibi z 1.10 {\displaystyle z_{1.10}} de tanımsızdır.

γ {\displaystyle \gamma } z γ {\displaystyle z_{\gamma }} γ {\displaystyle \gamma } z γ {\displaystyle z_{\gamma }}
0.68 0,994457883210 0.999 3,290526731492
0.90 1,644853626951 0.9999 3,890591886413
0.95 1,959963984540 0.99999 4,417173413469
0.98 2,326347874041 0.999999 4,891638475699
0,99 2,575829303549 0,9999999 5,326723886384
0.995 2,807033768344 0,99999999 5,730728868236
0,997 2,967737925342 0,999999999 6,109410204869

p = 0.5 {\displaystyle p=0.5} iken max σ P 2 = max P ( 1 P ) = 0.25 {\displaystyle \max \sigma _{P}^{2}=\max P(1-P)=0.25} olduğundan,

p = p ¯ = 0.5 {\displaystyle p={\overline {p}}=0.5} şeklinde keyfi bir ayarlama ile γ {\displaystyle \gamma } güven seviyesinde ve n {\displaystyle n} örnek boyutunda gerçek sonuçları almadan önce bile P {\displaystyle P} 'nin maksimum hata payını elde etmek için σ P {\displaystyle \sigma _{P}} , σ p ¯ {\displaystyle \sigma _{\overline {p}}} ve z γ σ p ¯ {\displaystyle z_{\gamma }\sigma _{\overline {p}}} değerleri hesaplanabilir. Örneğin p = 0.5 , n = 1013 {\displaystyle p=0.5,n=1013} iken;

M O E 95 ( 0.5 ) = z 0.95 σ p ¯ z 0.95 σ P 2 n = 1.96 .25 n = 0.98 / n = ± 3.1 % {\displaystyle MOE_{95}(0.5)=z_{0.95}\sigma _{\overline {p}}\approx z_{0.95}{\sqrt {\frac {\sigma _{P}^{2}}{n}}}=1.96{\sqrt {\frac {.25}{n}}}=0.98/{\sqrt {n}}=\pm 3.1\%}
M O E 99 ( 0.5 ) = z 0.99 σ p ¯ z 0.99 σ P 2 n = 2.58 .25 n = 1.29 / n = ± 4.1 % {\displaystyle MOE_{99}(0.5)=z_{0.99}\sigma _{\overline {p}}\approx z_{0.99}{\sqrt {\frac {\sigma _{P}^{2}}{n}}}=2.58{\sqrt {\frac {.25}{n}}}=1.29/{\sqrt {n}}=\pm 4.1\%}

Ayrıca, bildirilen herhangi bir M O E 95 {\displaystyle MOE_{95}} için

M O E 99 = z 0.99 z 0.95 M O E 95 1.3 × M O E 95 {\displaystyle MOE_{99}={\frac {z_{0.99}}{z_{0.95}}}MOE_{95}\approx 1.3\times MOE_{95}}

Kaynakça

  • Sudman, Seymour ve Bradburn, Norman (1982). Sorular Sormak: Anket Tasarımı İçin Pratik Bir Kılavuz . San Francisco: Jossey Bass.0-87589-546-8ISBN 0-87589-546-8
  • Introductory Statistics. 5th. Wiley. 1990. ISBN 0-471-61518-8. Introductory Statistics. 5th. Wiley. 1990. ISBN 0-471-61518-8.  Introductory Statistics. 5th. Wiley. 1990. ISBN 0-471-61518-8. 

Dış bağlantılar

  • "Errors, theory of", Encyclopedia of Mathematics, EMS Press, 2001 [1994]
  • Weisstein, Eric W. "Margin of Error". MathWorld.