Çoklu sayılı özetleme tabloları

Çoklu sayılı özetleme tablosu betimsel istatistik alanında kullanılan genellikle aralıksal ölçekli veya oransal ölçekli tek değişirli sayısal verilerinin iki değişik tip özetleme araçlarıdır. Bu iki değişik özetleme araçları şunlardır:

  1. beş sayılı özetleme tablosu;
  2. yedi sayılı özetleme tablosu.

Beş sayılı özetleme tablosu

Açıklama

Michelson–Morley deneyi dikey kutu grafikleri aynı zamanda beş-sayılı özetlemeleri de gösterir.

Beş sayılı özetleme tablosu bir betimsel istatistik veri özetleme araci olup bir örneklem veri serisinin alt ve üst uç noktalarından ve sıralanmış verilerini dört eşit parçaya bölen üç ölçüden oluşur; bu beş nokta şunlardır:

  1. Xmin: Örneklem minimumu "en küçük gözlem değeri"
  2. Q1: Dörttebirlik "birinci veya alt dörttebirlik"
  3. Xmed: Medyan "ortanca veya sıralanmış verilerin ortası"
  4. Q1 : Dörttebirlik "üçüncü veya üst dörttebirlik"
  5. Xmaks: Örneklem maksimumu "en büyük gözlem değeri"

Bu noktalar soyle bir tabloya konulabilir:

            Xmed
        Q1         Q3
   Xmin                Xmaks

Tablonun alternatif görünüşü şōyle de olabilir:

Medyan
Alt dörttebirlik Üst dörttebirlik
Minimum Maksimum

Bu araç ve kullandığı beş özetleme noktası tek değişirli sayısal verilerinin genellikle aralıksal ölçekli veya oransal ölçekli olmalıdır. Bazı istatistikçiler sırasal ölçekli veriler için de uygun olacağını kabul etmektedir.

Kullanılış

Beş sayılı özetleme tablosu gözlemlerin dağılımı hakkında kapsamlı ama kısa bir özet sağlamaktadır. Beş tane özetleme sayısını vermekle tek bir özetleme ölçüsünü seçmenin zorluklarından kaçınılmış olmaktadır. Medyan verilmesi ile merkezsel konum niteliği özetlenmekte; minimum ve maksimum verilmekle açıklık değeri ve dörttebirlikler verilmekle çeyrekler açıklığı açıkça görülüp çokluluk dağılımının istatistiksel yayılma ve sapma niteliği ortaya çıkartılmaktadır. Bu grafiksel alet yalnız aralıklı ve orantılı ölçekli miktarsal veriler için değil de sırasal ölçekli veriler için de rahatlıkla kullanılabilmektedir.

Birkaç değişik veri dağılımının karşılaştırılması ya birkaç beş-sayılı özetleme tablosunun veya bunlarda kullanılan grafiksel birkaç kutu grafiği'ni birlikte vererek kolayca yapılabilme imkânı ortaya çıkmaktadır.

Örnek

Örnek veri güneş sistemi içindeki gezegenleri büyük küçük uydu sayısını vermektedir:

0, 0, 1, 2, 63, 61, 27, 13.

Önce bu gözlem verilerini artan bir sıralamaya tabi tutarız:

0, 0, 1, 2, 13, 27, 61, 63.

Elde 8 tane veri bulunmaktadır ve medyan ve dörttebirlikler şöyle bulunur:

Özet ölçü Sıra numarası Değer
Birinci dörttebirlik (8+1)(1/4)=2,75 0+(1-0)(0,75)=0,75
Medyan (8+1)(1/2)=4,5 (2+13)/2 = 7,5.
Üçüncü dörttebirlik (8+1)(3/4)=6,75 27+(61-27)(0,75)=52,5

Böylece beş-sayılı-özetleme tablosu şöyle verilebilir:

            7,5
        0,5         44
   0                  63

R istatistik yazılımı kullanarak örnek çözümü

İyi bilinen istatistik yazılımlarından başta gelenlerden olan "R programlama dili" ile beş-sayılı-özetleme tablosu kurmak için fivenum fonksiyonu kullanılır:

> uydular <- c(0, 0, 1, 2, 63, 61, 27, 13)
> fivenum(uydular)
[1]  0.0  0.5  7.5 44.0 63.0
> summary(fivenum(uydular))
   Min. 1st Qu. Median    Mean 3rd Qu.  Max. 
    0.0     0.5     7.5    23.0    44.0    63.0 

Görüldüğü gibi summary komutası kullanarak sonuç alınırken beş-sayılı-özetleme için gerekmeyen aritmetik ortalama değeri de verilmektedir.

Yedi sayılı özetleme tablosu

(Parametrik) Yedi-sayılı özetleme

Bir normal dağılımlı model için uygun parametrelerden oluşan ve bu nedenle parametrik istatistik yaklaşımı olarak kabul edilen bu tür "yedi sayılı özetleme tablosu"nda şu sayısal değerler bulunmaktadır:

  1. 2. yüzdebirlik
  2. 9. yüzdebirlik
  3. 25. yüzdebirlik veya alt dörttebirlik veya birinci dörttebirlik
  4. 50inci yüzdebirlik veyamedian (ortanca veya ikinci dörttebirlik)
  5. 75. yüzdebirlik veya üst dörttebirlik veya üçüncü dörttebirlik
  6. 91. yüzdebirlik
  7. 98. yüzdebirlik

Bu tablodaki ortadaki üç özetleme ölçüsü – alt dörttebirlik, medyan ve üst dörttebirlik – "beş-sayılı-özetleme" için standart istatistiklerdir ve kutu grafiği içinde de kullanılırlar.

Bowley’nin yedi-sayılı-özetleme tablosu

İngiliz istatistikçisi Arthur Bowley parametrik olmayan istatistik olarak maksimum ve minimum, medyan, dörttebirlikler ve iki uç ondabirliklerden oluşan bir "yedi-sayılı özetleme" önermiştir.[1]

Bu yedi özetleme ölçüsü şunlardır:

  1. Xmin : Örneklem minimumu
  2. D1 : "1. ondabirlik"
  3. Q1 : "1. dörttebirlik"
  4. Xmed: "medyan"
  5. Q3 : "3. dörttebirlik
  6. D9 : "9. ondabirlik"
  7. Xmax : "Örneklem maksimumu"

Ayrıca bakınız

Kaynakça

  1. ^ Bu özetlemeye "yedi pozisyon" adını vermektedir. Bowley, Arthur (1920) Elementary Manual of Statistics, 3. ed., say.62 .
  • Bu madde kısmen Ingilizce Wikipedia "Five-number_summary" maddesi kaynaklıdır: İngilizce Wikipedia 23 Şubat 2010 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erişme:28.5.2010)
  • Bu madde kısmen Ingilizce Wikipedia "Seven-number_summary" maddesi kaynaklıdır: [1]13 Haziran 2011 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erişme:28.5.2010)

Dış kaynaklar

  • Hoaglin, David C, Frederick Mosteller ve John W. Tukey (1983), Understanding robust and exploratory data analysis New York:Wiley ISBN 0-471-09777-2 (İngilizce)
  • g
  • t
  • d
Betimsel istatistik
Sürekli veriler
Merkezî konum
Yayılma
Dağılım şekli
Varyans • Çarpıklık • Basıklık • Moment (matematik)
İstatistiksel tablolar
Sıklık dağılımı  • Çoklu sayılı özetleme tabloları  • İlişki tablosu  • Çoklu-yönlü sınıflandırma tabloları
İstatistiksel grafikler
Dairesel grafik • Çubuk grafiği • Kutu grafiği • Dal-yaprak grafikleri •Kontrol diyagramı • Histogram • Sıklık çizelgesi • Q-Q grafiği • Serpilme diyagramı
Veri toplama
Örnek tasarımı
Deneysel tasarım
Anakütle • İstatistiksel deneysel tasarım tipleri  • Deneysel hata  • Yineleme • Bloklama • Duyarlılık ve belirleme
Örneklem kavramları
Örneklem büyüklüğü • Sınama gücü  • Etki büyüklüğü • Örnekleme dağılımı •Standart hata
Çıkarımsal istatistik
ve
İstatistiksel kestirim ve testler
Çıkarımsal analiz tipleri
Kestirim  • Parametrik çıkarımsal analiz  •Parametrik olmayan çıkarımsal analiz  • Bayesci çıkarımsal analiz  • Meta-analiz
Çıkarımsal kestirim
Genel kestirim kavramları
Momentler yöntemi • Enbüyük olabilirlik • Enbüyük artçıl  • Bayes-tipi kestirimci • Minimum uzaklık • Maksimum aralık verme
Tekdeğişkenli kestirim
Kestirim  • Güven aralığı  • İnanılır aralık
Hipotez testi
İstatistiksel test ana kavramları
Sıfır hipotez  • I.Tür ve II.Tür hata  • Anlamlılık seviyesi  •p-değeri
Basit tek-değişkenli ve iki-değişkenli
parametrik hipotez testi
μ için testi •

π için test • μ12 için test • π12 için test  •

σ12 için test
Tek-değişkenli ve iki-değişkenli
parametrik olmayan test analizi
Medyan testi  • Ki-kare testi • Pearson ki-kare testi •Phi katsayısı  • Wald testi • Mann-Whitney U testi • Wilcoxon'in işaretli sıralama testi
Korelasyon
ve
Regresyon analizi
Korelasyon
Doğrusal regresyon
Regresyon analizi  • Doğrusal model • Genel doğrusal model • Genelleştirilmiş doğrusal model
Doğrusal olmayan regresyon
Parametrik olmayan • Yarıparametrik • Logistik
Varyans analizi
Tek-yönlü varyans analizi • Kovaryans analizi • Bloklu tek-yönlü varyans analizi • Etki karışımı değişkeni
Çokdeğişkenli istatistik
Çokdeğişkenli regresyon • temel bileşenler · Faktör analizi  •Kanonik korelesyon  • Uygunluk analizi  • Kümeleme analizi
Zaman serileri analizi
Yapısal model tanımlanması
Zaman serisi yapisal model ögeleri  • Zaman serisi ögeleri saptanması  • Zaman grafiği • Korrelogram
Zaman serileri kestirim teknik ve modelleri
Dekompozisyon • Trend uygulama kestirimi  • Üssel düzgünleştirme  • ARIMA modelleri  • Box–Jenkins  • Spektral yoğunluk kestirimi
Kestirim değerlendirmesi
Zaman seri kestirim değerlendirmesi
Sağkalım analizi
Sağkalım fonksiyonu • Kaplan–Meier • Log-sıra testi • Başarısızlık oranı • orantılı tehlikeler modeli
Kategori • Outline • Endeks