Phi katsayısı

Phi katsayısı veya Φ - katsayısı veya ortalama kare kontenjansı katsayısı olarak isimlendirilen ve matematik notasyonla by φ (veya rφ) olarak ifade edilen iki tane iki-değerli isimsel veya sırasal değişkenin birbirine "birliktelik (association)" ilişkisini gösteren ölçü katsayılarıdır.

İlk defa istatistikçi Karl Pearson tarafından ortaya atılmışlardır.[1] Bu ölçü katsayısının anlamı kavram olarak Pearson çarpım-moment korelasyon katsayısı kavramına çok yakındır. Gerçekten de "phi-katsayısı" iki (0-1) değer alan kategorik değişken için Pearson'un korelasyon katsayısı formülünün uygulanması ile ortaya çıkarılmıştır.[2] Diğer taraftan "phi-katsayısı" karesi 2x2 kontenjans tablosu için hesaplanan "ki-kare" değeri ile ve Pearson'un ki-kare testi ile yakından ilişkilidir.[3]

Tanımlama ve hesaplama

Bu phi-katsayısı şöyle ifade edilir:

ϕ 2 = χ 2 n {\displaystyle \phi ^{2}={\frac {\chi ^{2}}{n}}}

Burada n örneklem gözlem sayısıdır. Genel iki (0,1)değerli x ve y değişkenli bir 2x2 kontenjans tablosu şöyle yazılabilir:

y = 0 y = 1 Satır toplamı
x = 0 n 00 {\displaystyle n_{00}} n 01 {\displaystyle n_{01}} n 0 {\displaystyle n_{0\bullet }}
x = 1 n 10 {\displaystyle n_{10}} n 11 {\displaystyle n_{11}} n 1 {\displaystyle n_{1\bullet }}
Sütun toplamı n 0 {\displaystyle n_{\bullet 0}} n 1 {\displaystyle n_{\bullet 1}} n {\displaystyle n}

Burada n11, n10, n01, n00 hücredeki veri sayılarıdır; n 0 {\displaystyle n_{0\bullet }} , n 1 {\displaystyle n_{1\bullet }} : satır toplamları; n 0 {\displaystyle n_{\bullet 0}} ve n 1 {\displaystyle n_{\bullet 1}}  : sütun toplamları ve n tüm toplam gözlem sayısıdır.

Phi-katsayısı bu 2x2 kontenjans tablosundan şöyle hesaplanabilir:

ϕ = n 00 n 11 n 01 n 10 n 0 n 1 n 1 n 0 {\displaystyle \phi ={\frac {n_{00}n_{11}-n_{01}n_{10}}{\sqrt {n_{0\bullet }n_{1\bullet }n_{\bullet 1}n_{\bullet 0}}}}}

Phi-katsayısı (tümüyle negatif bağımlı olan) -1 'den bir maksimum değere kadar değişir. Eğer her iki değişken %50:%50 olarak bölünmüşlerse bu maksimum değer +1 olur ve aksi halde +1'in altındadır.

"Birliktelik" "eğer bir veri sujesinin hangi hücrenin belirli bir satırına dahil olduğunu bilirsek onun hangi sütuna dahil olacağını tahmin edebilir miyiz?" şeklinde de ifade edilebilir. Eğer iki (0-1) değerli kategorik değişken "pozitif birliktelik" gösterirse verilerin çok büyük bir kısmı diyagonal üzerinde bulunur; eğer "negatif birliktelik" gösterirse verilerin çoğunluğu diygonal dışında bulunurlar.

Hesaplanan phi-katsayısı şöyle açıklanabilir:[4][5]

  • -1.0 ile -0.7 arası güçlü negatif bağımlılık;
  • -0.7 ile -0.3 arası zayıf negatif bağımlılık;
  • -0.3 ile +0.3 0 veya çok küçük bağımlılık;
  • +0.3 ile +0.7 arası zayıf pozitif bağımlılık;
  • +0.7 ile +1.0 arası güçlü pozitif bağımlılık;

Örnek

Bir işyerinde çalışanlar iki tipe ayrılmışlardır "memur" ve "hizmetli". Bu işyerinde iki türlü ücret ödemesi yapılmaktadır: sabit aylık "maaş" ve çalışılan saate göre "ücret". "Çalışan ayrımı" ile "ödeme ayrımı" değişkenleri arasında ne şekilde bir ilişki mevcut olduğu araştırma sorunudur. Bunlara için 86 adet gözlem toplanmıştır ve bu iki tane iki değerli veri ayrımlara göre şu 2x2 kontenjans tablosunda gösterilmiştir. Bu tabloda sütun toplamları, satır toplamları ve toplam veri sayısı da gösterilmektedir.

Hizmetli = 0 Memur = 1 Ödeme tipi toplamı
Saate ücret = 0 33 2 35
Aylık maaş = 1 33 18 51
Çalışan toplamı 66 20 86

Böylece elimizde (0-1) değerli iki kategori değişkeni bulunmaktadır. Elimizdeki verileri "phi-katsayısı" formülüne koyarsak şu sonucu elde ederiz.

ϕ = 33 × 18 2 × 33 66 × 20 × 35 × 51 {\displaystyle \phi ={\frac {33\times 18-2\times 33}{\sqrt {66\times 20\times 35\times 51}}}}
ϕ = 1516 1899.3 {\displaystyle \phi ={\frac {1516}{1899.3}}}
ϕ = 0.798 {\displaystyle \phi =0.798}

Bu örnek için elde ettiğimiz "phi-katsayısı" değeri 0.0661491858 olarak bulunmuştur ve bu değer -0.3 ile +0.3arasında olduğu için 0 veya çok güçsüz bağımlılık gösterir.

Ayrıca bakınız

Notlar

  • İngilizce Wikipedia "Phi coefficient" maddesi 5 Nisan 2012 tarihinde Wayback Machine sitesinde arşivlendi.
  1. ^ Cramer, H. 1946. Mathematical Methods of Statistics. Princeton: Princeton University Press, s.282 (ikinci paragraf). ISBN 0-691-08004-6
  2. ^ Guilford, J. (1936). Psychometric Methods. New York: McGraw –Hill Book Company, Ing
  3. ^ Everitt B.S. (2002) The Cambridge Dictionary of Statistics, CUP. ISBN 0-521-81099-X
  4. ^ Phi-kaytsayısı ve açıklaması[ölü/kırık bağlantı].
  5. ^ Conover WJ P)1980) Practical Nonparametric Statistics, 2.ed New York NY: John Wiley and Sons, Inc. ş.181.

Dış bağlantılar

  • Guilford, J. (1936), Psychometric Methods. New York: McGraw–Hill Book Company, İnç. (İngilizce)
  • Everitt B.S. (2002), The Cambridge Dictionary of Statistics, CUP. ISBN 0-521-81099-X (İngilizce)
  • Davenport, E. ve El-Sanhury, N. (1991), "Phi/Phimax: Review and Synthesis" Educational and Psychological Measurement C.51, s.821–828. (İngilizce)
  • g
  • t
  • d
İstatistik
Betimsel istatistik
Sürekli veriler
Merkezî konum
Ortalama (Aritmetik, Geometrik, Harmonik) • Medyan • Mod
Yayılma
Açıklık • Standart sapma • Varyasyon katsayısı • Çeyrekler açıklığı • Kesirlilikler (kantil) (Dörttebirlik,Ondabirlik, Yüzdebirlik)
Dağılım şekli
Varyans • Çarpıklık • Basıklık • Moment (matematik)
İstatistiksel tablolar
Sıklık dağılımı  • Çoklu sayılı özetleme tabloları  • İlişki tablosu  • Çoklu-yönlü sınıflandırma tabloları
İstatistiksel grafikler
Dairesel grafik • Çubuk grafiği • Kutu grafiği • Dal-yaprak grafikleri •Kontrol diyagramı • Histogram • Sıklık çizelgesi • Q-Q grafiği • Serpilme diyagramı
Veri toplama
Örnek tasarımı
Deneysel tasarım
Anakütle • İstatistiksel deneysel tasarım tipleri  • Deneysel hata  • Yineleme • Bloklama • Duyarlılık ve belirleme
Örneklem kavramları
Örneklem büyüklüğü • Sınama gücü  • Etki büyüklüğü • Örnekleme dağılımı •Standart hata
Çıkarımsal istatistik
ve
İstatistiksel kestirim ve testler
Çıkarımsal analiz tipleri
Kestirim  • Parametrik çıkarımsal analiz  •Parametrik olmayan çıkarımsal analiz  • Bayesci çıkarımsal analiz  • Meta-analiz
Çıkarımsal kestirim
Genel kestirim kavramları
Momentler yöntemi • Enbüyük olabilirlik • Enbüyük artçıl  • Bayes-tipi kestirimci • Minimum uzaklık • Maksimum aralık verme
Tekdeğişkenli kestirim
Kestirim  • Güven aralığı  • İnanılır aralık
Hipotez testi
İstatistiksel test ana kavramları
Sıfır hipotez  • I.Tür ve II.Tür hata  • Anlamlılık seviyesi  •p-değeri
Basit tek-değişkenli ve iki-değişkenli
parametrik hipotez testi
μ için testi •

π için test • μ12 için test • π12 için test  •

σ12 için test
Tek-değişkenli ve iki-değişkenli
parametrik olmayan test analizi
Medyan testi  • Ki-kare testi • Pearson ki-kare testi •Phi katsayısı  • Wald testi • Mann-Whitney U testi • Wilcoxon'in işaretli sıralama testi
Korelasyon
ve
Regresyon analizi
Korelasyon
Doğrusal regresyon
Regresyon analizi  • Doğrusal model • Genel doğrusal model • Genelleştirilmiş doğrusal model
Doğrusal olmayan regresyon
Parametrik olmayan • Yarıparametrik • Logistik
Varyans analizi
Tek-yönlü varyans analizi • Kovaryans analizi • Bloklu tek-yönlü varyans analizi • Etki karışımı değişkeni
Çokdeğişkenli istatistik
Çokdeğişkenli regresyon • temel bileşenler · Faktör analizi  •Kanonik korelesyon  • Uygunluk analizi  • Kümeleme analizi
Zaman serileri analizi
Yapısal model tanımlanması
Zaman serisi yapisal model ögeleri  • Zaman serisi ögeleri saptanması  • Zaman grafiği • Korrelogram
Zaman serileri kestirim teknik ve modelleri
Dekompozisyon • Trend uygulama kestirimi  • Üssel düzgünleştirme  • ARIMA modelleri  • Box–Jenkins  • Spektral yoğunluk kestirimi
Kestirim değerlendirmesi
Zaman seri kestirim değerlendirmesi
Sağkalım analizi
Sağkalım fonksiyonu • Kaplan–Meier • Log-sıra testi • Başarısızlık oranı • orantılı tehlikeler modeli
Kategori • Outline • Endeks