İstatistiksel yayılma ve sapma

İstatistiksel yayılma ve sapma (diğer adlarıyla istatistiksel değişkenlik veya varyasyon) istatistik biliminde bir sayısal kantitatif değişkenin ölçülen veya ölçülebilen değerlerinin veya bir olasılık dağılımı'nın genel olarak veya bir merkez noktasından yaygınlığı veya değişebilirliği özelliğidir. İstatistiksel yayılma veya sapma kantitatif değişkenlerin veya rassal değişkenlerin diğer bir özelliği olan merkezsel konum ölçüleri ile birlikte istatistikçilerin en çok ilgilendikleri konulardır. Genel olarak günlük hayatta en çok kullanılan yayılma ölçüsü açıklık olmakla beraber, bunun gayet bariz olarak aykırı değerlerden çok etkilenmesi dolayısı ile çeyrekler açıklığı, standart sapma ve varyans gibi diğer çok kullanılan yayılma ölçüleri geliştirilmiştir.

İstatistiksel yayılma

Eğer bir değişkenin tüm değerleri veya gözlemlenen değerleri birbirine özdeş olarak tek ve sadece tek bir değer alırsa istatistiksel yayılım sıfırdır. Değişken değerleri daha farklı değerler almaya başladıkça yayılma artmaya başlayarak yayılma ölçüsü sıfırdan başka değerler alır.

İstatistiksel yayılma ölçüleri için değişik sınıflama şekilleri vardır. Bir çeşit sınıflama yayılımın ölçümünün herhangi bir belli merkezsel noktaya referansla yapılıp yapılmadığına göredir. Açıklık veya çeyrekler açıklığı yayılım ölçüleri için herhangi bir diğer merkezsel noktaya referans verilmez. Ortalama mutlak sapma, standart sapma veya varyans için ise belirli bir merkezsel konum noktası, aritmetik ortalama, bir çapa noktası gibi bir referans noktası olur ve yayılma bu merkezsel referans noktasından sapmalar ile ölçülür.

Diğer bir sınıflama yayılma ölçülerinin ölçülme birimlerinin özelliklerine dayanır:

Bazı yayılım ölçleri boyutsuz olup ölçülmeleri için hiçbir birimi olmayıp sade ve sade hiçbir birimi olmayan bir saf sayı olarak ifade edilirler. Ama bu halde değişken verileri için boyut veya birim bulunmamaktadır. Bunlara örnek:

Yayılım ölçülerinin çok büyük bir kısmı için "yayılım ölçüsü değişkenin ölçüldüğü birim" ile ölçülür. Örneğin değişkenler metre veya dakika ile ölçülmekte ise yayılma ölçüleri de ayni birimde olan metre veya dakika ile ölçülürler. Bunlara örnek:

Bu türdeki istatistiksel yayılma ölçüleri sadece değişmez-birimli olmayıp değişmez konumluluk" ve boyuta göre doğrusal olma özelliklerine de sahiptirler. Böylece bir rassal değişken olan X için SX olan yayılım ölçüsü ise, bunun bir doğrusal dönüşümü olan

Y = aX + b    a ve b reel sayıları için

ifadesi için de yayılım ölçüsü

SY = |a|SX

olur.

Diğer istatistiksel yayılım ölçüleri değişken değerleri ile ilgili ama değişik birimlerdedir. Varyans standart sapmanın karesi olduğu için, değişkenin ölçme biriminin karesi birimindedir. Örneğin değişken metre ile ölçülürse varyans metre kare birimlidir. Bu nedenle varyansın konumu değişmez ama boyuta göre doğrusal değildir.

Bazı yayılma ölçüleri özel maksatlarla geliştirilmişlerdir. Bunlar arasında (saatler, osiloskoplar, amplifikatörler vb için) ve frekanslarla ilgili olarak "Allan varyansı" ve "Hadarmand varyansı" kayda değer yayılım ölçülerdir.

Kategorik değişkenler için yayılma ve sapmanın tanımlanıp ölçülmesi kavramsal olarak daha zor açıklanmaktadır ve genellikle fen ve teorik matematik temelli istatistikçiler tarafından kategorik veri yayılma ölçüleripek kullanılmamakta olduğu için geldirilmemişlerdir. Ancak kategorik veriler ile çok uğrasan sosyal bilimler içinde bu çeşit kalitatif yayılma ölçüleri geliştirilmiştir.

İstatistiksel yayılmanın kaynakları

Fiziksel bilimlerde yayılma ve değişkenlik ölçülme hatalarının rassal olmalarından doğmaktadır. Ölçüm enstrümanları hiçbir zaman hiç kusursuz ve tam mükemmel değildirler. Bu bilimlerde ölçülen kantitenin sabit ve hiç değişmediği genellikle kabul edilir ve böylece değişkenlik ölçümlerin arasında farklardan, yani gözlem hatası nedeni ile ortaya çıkar.

Bu varsayım biyolojik bilimlerde doğru değildir. Gözlemlenen fenomen incelenen fenomenin kendine özel karakteri dolayısıyla diğerlerinden farklıdır ve anakütlenin değişik üyeleri birbirlerinde çok genel ayrılıklar gösterirler.

Sosyal bilimlere gelince biyolojik bilimlerden çok daha fazla sayıda değişkenlik doğuran faktörler (tarihsel, fizyolojik, psikolojik, politik, sosyal) nedenlerle incelenen karakterlerde büyük yayılma gösterebilirler.

Dipnotlar

Ayrıca bakınız

Dış bağlantılar

  • İngilizce Wikipedia "Statistical dispersion" maddesi:[1] 4 Mart 2010 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erişim: 7.5.2010)
  • g
  • t
  • d
Betimsel istatistik
Sürekli veriler
Merkezî konum
Yayılma
Dağılım şekli
Varyans • Çarpıklık • Basıklık • Moment (matematik)
İstatistiksel tablolar
Sıklık dağılımı  • Çoklu sayılı özetleme tabloları  • İlişki tablosu  • Çoklu-yönlü sınıflandırma tabloları
İstatistiksel grafikler
Dairesel grafik • Çubuk grafiği • Kutu grafiği • Dal-yaprak grafikleri •Kontrol diyagramı • Histogram • Sıklık çizelgesi • Q-Q grafiği • Serpilme diyagramı
Veri toplama
Örnek tasarımı
Deneysel tasarım
Anakütle • İstatistiksel deneysel tasarım tipleri  • Deneysel hata  • Yineleme • Bloklama • Duyarlılık ve belirleme
Örneklem kavramları
Örneklem büyüklüğü • Sınama gücü  • Etki büyüklüğü • Örnekleme dağılımı •Standart hata
Çıkarımsal istatistik
ve
İstatistiksel kestirim ve testler
Çıkarımsal analiz tipleri
Kestirim  • Parametrik çıkarımsal analiz  •Parametrik olmayan çıkarımsal analiz  • Bayesci çıkarımsal analiz  • Meta-analiz
Çıkarımsal kestirim
Genel kestirim kavramları
Momentler yöntemi • Enbüyük olabilirlik • Enbüyük artçıl  • Bayes-tipi kestirimci • Minimum uzaklık • Maksimum aralık verme
Tekdeğişkenli kestirim
Kestirim  • Güven aralığı  • İnanılır aralık
Hipotez testi
İstatistiksel test ana kavramları
Sıfır hipotez  • I.Tür ve II.Tür hata  • Anlamlılık seviyesi  •p-değeri
Basit tek-değişkenli ve iki-değişkenli
parametrik hipotez testi
μ için testi •

π için test • μ12 için test • π12 için test  •

σ12 için test
Tek-değişkenli ve iki-değişkenli
parametrik olmayan test analizi
Medyan testi  • Ki-kare testi • Pearson ki-kare testi •Phi katsayısı  • Wald testi • Mann-Whitney U testi • Wilcoxon'in işaretli sıralama testi
Korelasyon
ve
Regresyon analizi
Korelasyon
Doğrusal regresyon
Regresyon analizi  • Doğrusal model • Genel doğrusal model • Genelleştirilmiş doğrusal model
Doğrusal olmayan regresyon
Parametrik olmayan • Yarıparametrik • Logistik
Varyans analizi
Tek-yönlü varyans analizi • Kovaryans analizi • Bloklu tek-yönlü varyans analizi • Etki karışımı değişkeni
Çokdeğişkenli istatistik
Çokdeğişkenli regresyon • temel bileşenler · Faktör analizi  •Kanonik korelesyon  • Uygunluk analizi  • Kümeleme analizi
Zaman serileri analizi
Yapısal model tanımlanması
Zaman serisi yapisal model ögeleri  • Zaman serisi ögeleri saptanması  • Zaman grafiği • Korrelogram
Zaman serileri kestirim teknik ve modelleri
Dekompozisyon • Trend uygulama kestirimi  • Üssel düzgünleştirme  • ARIMA modelleri  • Box–Jenkins  • Spektral yoğunluk kestirimi
Kestirim değerlendirmesi
Zaman seri kestirim değerlendirmesi
Sağkalım analizi
Sağkalım fonksiyonu • Kaplan–Meier • Log-sıra testi • Başarısızlık oranı • orantılı tehlikeler modeli
Kategori • Outline • Endeks