Chi-kwadraatverdeling

chi-kwadraatverdeling
Kansdichtheid
Kansverdeling voor verschillende k's
Verdelingsfunctie
Parameters n > 0 {\displaystyle n>0} vrijheidsgraden
Drager x [ 0 , + ) {\displaystyle x\in [0,\,+\infty )}
Kansdichtheid ( 1 / 2 ) n / 2 Γ ( n / 2 ) x n / 2 1 e x / 2 {\displaystyle {\frac {(1/2)^{n/2}}{\Gamma (n/2)}}x^{n/2-1}e^{-x/2}}
Verdelingsfunctie γ ( n / 2 , x / 2 ) Γ ( n / 2 ) {\displaystyle {\frac {\gamma (n/2,x/2)}{\Gamma (n/2)}}}
Verwachtingswaarde n {\displaystyle n}
Mediaan bij benadering n 2 / 3 {\displaystyle n-2/3}
Modus n 2 {\displaystyle n-2} als n 2 {\displaystyle n\geq 2}
Variantie 2 n {\displaystyle 2n}
Scheefheid 8 / n {\displaystyle {\sqrt {8/n}}}
Kurtosis 12 / n {\displaystyle 12/n}
Entropie n 2 + ln ( 2 Γ ( n / 2 ) ) + ( 1 n / 2 ) ψ ( n / 2 ) {\displaystyle {\frac {n}{2}}+\ln(2\Gamma (n/2))+(1-n/2)\psi (n/2)}
Moment-
genererende functie
( 1 2 t ) n / 2 {\displaystyle (1-2t)^{-n/2}} voor 2 t < 1 {\displaystyle 2t<1}
Karakteristieke functie ( 1 2 i t ) n / 2 {\displaystyle (1-2it)^{-n/2}}
Portaal  Portaalicoon   Wiskunde

De chi-kwadraatverdeling of χ2-verdeling is afgeleid van de normale verdeling en verbonden met de verdeling van de steekproefvariantie van een aselecte steekproef uit een normale verdeling. Het is de verdeling van de som van de kwadraten van n {\displaystyle n} onderling onafhankelijke standaard-normaal verdeelde variabelen Z 1 , , Z n {\displaystyle Z_{1},\ldots ,Z_{n}} , dus van:

χ n 2 = Z 1 2 + + Z n 2 {\displaystyle \chi _{n}^{2}=Z_{1}^{2}+\ldots +Z_{n}^{2}}

De parameter n {\displaystyle n} wordt het aantal vrijheidsgraden genoemd. De chi-kwadraatverdeling is een speciaal geval van de gamma-verdeling.

Kansdichtheid

De kansdichtheid f n {\displaystyle f_{n}} van de chi-kwadraatverdeling met n {\displaystyle n} vrijheidsgraden wordt voor x > 0 {\displaystyle x>0} gegeven door

f n ( x ) = 1 2 n 2 Γ ( n 2 ) x n 2 1 e x 2 {\displaystyle f_{n}(x)={\frac {1}{2^{\frac {n}{2}}\Gamma ({\frac {n}{2}})}}x^{{\frac {n}{2}}-1}e^{-{\frac {x}{2}}}}

De verdelingsfunctie is:

F n ( x ) = 0 x 1 2 n 2 Γ ( n 2 ) z n 2 1 e z 2 d z = {\displaystyle F_{n}(x)=\int _{0}^{x}{\frac {1}{2^{\frac {n}{2}}\Gamma ({\frac {n}{2}})}}z^{{\frac {n}{2}}-1}e^{-{\frac {z}{2}}}\,\mathrm {d} z=}
= 1 Γ ( n 2 ) 0 x / 2 t n 2 1 e t d t = γ ( n 2 , x 2 ) Γ ( n 2 ) {\displaystyle ={\frac {1}{\Gamma ({\frac {n}{2}})}}\int _{0}^{x/2}t^{{\frac {n}{2}}-1}e^{-t}\,\mathrm {d} t={\frac {\gamma ({\frac {n}{2}},{\frac {x}{2}})}{\Gamma ({\frac {n}{2}})}}}

Daarin is γ {\displaystyle \gamma } de onvolledige gammafunctie.

Eigenschappen

De verwachtingswaarde van de chi-kwadraatverdeling met n {\displaystyle n} vrijheidsgraden is juist gelijk aan n {\displaystyle n} en de variantie is 2 n {\displaystyle 2n} .

Toepassing

Voor de (gebruikelijke) steekproefvariantie

S 2 = 1 n 1 i = 1 n ( X i X ¯ ) 2 {\displaystyle S^{2}={\frac {1}{n-1}}\sum _{i=1}^{n}(X_{i}-{\bar {X}})^{2}}

van een aselecte steekproef van omvang n {\displaystyle n} uit een N ( μ , σ 2 ) {\displaystyle N(\mu ,\sigma ^{2})} -verdeling volgt uit de stelling van Cochran dat:

( n 1 ) S 2 σ 2 χ n 1 2 {\displaystyle (n-1){\frac {S^{2}}{\sigma ^{2}}}\sim \chi _{n-1}^{2}}

Dit is geen bijzonderheid, want de chi-kwadraatverdeling is juist ontwikkeld als de verdeling van deze grootheid. Dit kan enigszins plausibel gemaakt worden door te schrijven:

( n 1 ) S 2 σ 2 = 1 σ 2 i = 1 n ( X i X ¯ ) 2 = i = 1 n ( X i μ σ ) 2 ( X ¯ μ σ / n ) 2 = i = 1 n Z i 2 Z 0 2 , {\displaystyle (n-1){\frac {S^{2}}{\sigma ^{2}}}={\frac {1}{\sigma ^{2}}}\sum _{i=1}^{n}(X_{i}-{\bar {X}})^{2}=\sum _{i=1}^{n}\left({\frac {X_{i}-\mu }{\sigma }}\right)^{2}-\left({\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\right)^{2}=\sum _{i=1}^{n}Z_{i}^{2}-Z_{0}^{2},}

waarin alle Z {\displaystyle Z} 's standaardnormaal verdeeld zijn. Nu kan bewezen worden dat X ¯ {\displaystyle {\bar {X}}} en S 2 {\displaystyle S^{2}} onderling onafhankelijk zijn, en dus ook Z 0 {\displaystyle Z_{0}} en S 2 {\displaystyle S^{2}} .

Aangezien:

Z 0 2 χ 1 2 {\displaystyle Z_{0}^{2}\sim \chi _{1}^{2}}

en

( n 1 ) S 2 σ 2 + Z 0 2 = i = 1 n Z i 2 χ n 2 {\displaystyle (n-1){\frac {S^{2}}{\sigma ^{2}}}+Z_{0}^{2}=\sum _{i=1}^{n}Z_{i}^{2}\sim \chi _{n}^{2}}

volgt het gestelde.

Afleiding van de dichtheid

De dichtheid van de toevalsvariabele χ n 2 = X 1 2 + + X n 2 {\displaystyle \chi _{n}^{2}=X_{1}^{2}+\ldots +X_{n}^{2}} , waarin X 1 , , X n {\displaystyle X_{1},\ldots ,X_{n}} onderling onafhankelijk en standaardnormaal verdeeld zijn, volgt uit de simultane dichtheid van X 1 , , X n {\displaystyle X_{1},\ldots ,X_{n}} . Deze simultane dichtheid is het n {\displaystyle n} -voudige product van de standaardnormale dichtheid:

f X 1 , , X n ( x 1 , , x n ) = i = 1 n e 1 2 x i 2 2 π = ( 2 π ) n 2 e 1 2 ( x 1 2 + + x n 2 ) . {\displaystyle f_{X_{1},\dots ,X_{n}}(x_{1},\ldots ,x_{n})=\prod _{i=1}^{n}{\frac {e^{-{\frac {1}{2}}x_{i}^{2}}}{\sqrt {2\pi }}}=(2\pi )^{-{\frac {n}{2}}}e^{-{\frac {1}{2}}(x_{1}^{2}+\ldots +x_{n}^{2})}.}

Voor de gezochte dichtheid geldt:

f χ n 2 ( z ) = lim h 0 1 h P ( z < χ n 2 z + h ) = lim h 0 1 h K ( 2 π ) n 2 e 1 2 ( x 1 2 + + x n 2 ) d x 1 d x n = ( 2 π ) n 2 e z 2 lim h 0 1 h K d x 1 d x n {\displaystyle {\begin{aligned}f_{\chi _{n}^{2}}(z)&=\lim _{h\to 0}{\tfrac {1}{h}}P(z<\chi _{n}^{2}\leq z+h)\\&=\lim _{h\to 0}{\tfrac {1}{h}}\int \limits _{K}(2\pi )^{-{\frac {n}{2}}}e^{-{\frac {1}{2}}(x_{1}^{2}+\ldots +x_{n}^{2})}\,\mathrm {d} x_{1}\ldots \,\mathrm {d} x_{n}\\&=(2\pi )^{-{\tfrac {n}{2}}}e^{-{\frac {z}{2}}}\lim _{h\to 0}{\tfrac {1}{h}}\int \limits _{K}\,\mathrm {d} x_{1}\ldots \,\mathrm {d} x_{n}\\\end{aligned}}}

met K = { z x 1 2 + + x n 2 z + h } {\displaystyle K=\{z\leq x_{1}^{2}+\ldots +x_{n}^{2}\leq z+h\}}

In de limiet is die som in de e-macht gelijk aan z {\displaystyle z} , en daarom kan de e-macht buiten de integraal en voor de limiet gehaald worden.

De resterende integraal

K d x 1 d x n = V n ( z + h ) V n ( z ) , {\displaystyle \int \limits _{K}\,\mathrm {d} x_{1}\ldots \,\mathrm {d} x_{n}=V_{n}({\sqrt {z+h}})-V_{n}({\sqrt {z}}),}

is het volume van de bolschil tussen de bol met straal z + h {\displaystyle {\sqrt {z+h}}} en de bol met straal z {\displaystyle {\sqrt {z}}} .

V n ( R ) = π n 2 R n Γ ( n 2 + 1 ) {\displaystyle V_{n}(R)={\frac {\pi ^{\frac {n}{2}}R^{n}}{\Gamma ({\frac {n}{2}}+1)}}}

stelt het volume voor van de n {\displaystyle n} -dimensionale bol met straal R {\displaystyle R} .

Dus is:

lim h 0 1 h K d x 1 d x n = d V n ( z ) d z = π n 2 z n 2 1 Γ ( n 2 ) {\displaystyle \lim _{h\to 0}{\frac {1}{h}}\int \limits _{K}\,\mathrm {d} x_{1}\ldots \,\mathrm {d} x_{n}={\frac {\,\mathrm {d} V_{n}({\sqrt {z}})}{\,\mathrm {d} z}}={\frac {\pi ^{\tfrac {n}{2}}z^{{\tfrac {n}{2}}-1}}{\Gamma ({\tfrac {n}{2}})}}}

en na invullen in de uitdrukking voor de gezochte dichtheid volgt:

f χ n 2 ( z ) = z n 2 1 e z 2 2 n 2 Γ ( n 2 ) {\displaystyle f_{\chi _{n}^{2}}(z)={\frac {z^{{\frac {n}{2}}-1}e^{-{\frac {z}{2}}}}{2^{\frac {n}{2}}\Gamma ({\frac {n}{2}})}}}
· · Sjabloon bewerken
Kansverdelingen
Discrete verdelingen:Bernoulli · binomiaal · geometrisch · hypergeometrisch · negatief-binomiaal · Poisson · uniform · zèta
Continue verdelingen:bèta · Cauchy · chi-kwadraat · Erlang · exponentieel · F-verdeling · gamma · Gumbel · hyperexponentieel · logistisch · lognormaal · normaal · Pareto · Rayleigh · student (t-) · uniform · Weibull
Meerdimensionale verdelingen:multinomiaal · multivariaat normaal