Binomna raspodela

Binomna raspodela
Funkcija verovatnoće
Probability mass function for the binomial distribution
Funkcija kumulativne raspodele
Cumulative distribution function for the binomial distribution
Notacija B ( n , p ) {\displaystyle B(n,p)}
Parametri n { 0 , 1 , 2 , } {\displaystyle n\in \{0,1,2,\ldots \}} – broj pokušaja
p [ 0 , 1 ] {\displaystyle p\in [0,1]} – verovatnoća uspeha za svaki pokušaj
Nositelj k { 0 , 1 , , n } {\displaystyle k\in \{0,1,\ldots ,n\}} – broj uspeha
pmf ( n k ) p k ( 1 p ) n k {\displaystyle {\binom {n}{k}}p^{k}(1-p)^{n-k}}
CDF I 1 p ( n k , 1 + k ) {\displaystyle I_{1-p}(n-k,1+k)}
Prosek n p {\displaystyle np}
Medijana n p {\displaystyle \lfloor np\rfloor } ili n p {\displaystyle \lceil np\rceil }
Modus ( n + 1 ) p {\displaystyle \lfloor (n+1)p\rfloor } ili ( n + 1 ) p 1 {\displaystyle \lceil (n+1)p\rceil -1}
Varijansa n p ( 1 p ) {\displaystyle np(1-p)}
Koef. asimetrije 1 2 p n p ( 1 p ) {\displaystyle {\frac {1-2p}{\sqrt {np(1-p)}}}}
Kurtoza 1 6 p ( 1 p ) n p ( 1 p ) {\displaystyle {\frac {1-6p(1-p)}{np(1-p)}}}
Entropija 1 2 log 2 ( 2 π e n p ( 1 p ) ) + O ( 1 n ) {\displaystyle {\frac {1}{2}}\log _{2}\left(2\pi enp(1-p)\right)+O\left({\frac {1}{n}}\right)}
u šanonima.
MGF ( 1 p + p e t ) n {\displaystyle (1-p+pe^{t})^{n}}
CF ( 1 p + p e i t ) n {\displaystyle (1-p+pe^{it})^{n}}
PGF G ( z ) = [ ( 1 p ) + p z ] n {\displaystyle G(z)=[(1-p)+pz]^{n}}
Fišerova informacija g n ( p ) = n p ( 1 p ) {\displaystyle g_{n}(p)={\frac {n}{p(1-p)}}}
(za fiksno n {\displaystyle n} )
Binomna distribucija za p = 0 , 5 {\displaystyle p=0,5}
sa n i k kao u Paskalovom trouglu
Verovatnoća da će kugla u Galtonovoj kutiji sa 8 slojeva (n = 8) završiti u centralnoj kutiji (k = 4) je 70 / 256 {\displaystyle 70/256} .

U teoriji verovatnoće i statistici, binomna raspodela sa parametrima n i p je diskretna raspodela verovatnoće broja uspeha u sekvenci od n nezavisnih eksperimenata, svaki od kojih daje odgovor na da-ne pitanje, i svaki ima svoj bulov rezultat - uspeh/da/tačno/jedan (sa verovatnoćoḿ p) ili neuspeh/ne/lažno/nula (sa verovatnoćom q = 1 − p). Pojedinačni uspeh/neuspeh eksperimenta se takođe naziva Bernulijev pokušaj ili Bernulijev eksperiment, a sekvenca ishoda se naziva Bernulijev proces; za pojedinačni pokušaj, i.e., n = 1, binomna distribucija je Bernulijeva raspodela. Binomna distribucija je osnova za popularni binomni test statističkog značaja.

Binomna distribucija se često koristi za modelovanje broja uspeha u uzorku veličine n koji je izvučen sa zamenom iz populacije veličine N. Ako se uzorkovanje vrši bez zamene, izvlačenja nisu nezavisna, pa je rezultirajuća raspodela hipergeometrijska, a ne binomna. Međutim, za N mnogo veće od n, binomna distribucija ostaje dobra aproksimacija i široko se koristi.

Specifikacija

Funkcija verovatnoće

Generalno, ako randomna promenljiva X sledi binomnu distribuciju sa parametrima n ∈ ℕ i p ∈ [0,1], piše se X ~ B(np). Verovatnoća da se dobije tačno k uspeha u n pokušaja je data funkcijom verovatnoće:

f ( k , n , p ) = Pr ( k ; n , p ) = Pr ( X = k ) = ( n k ) p k ( 1 p ) n k {\displaystyle f(k,n,p)=\Pr(k;n,p)=\Pr(X=k)={\binom {n}{k}}p^{k}(1-p)^{n-k}}

za k = 0, 1, 2, ..., n, gde je

( n k ) = n ! k ! ( n k ) ! {\displaystyle {\binom {n}{k}}={\frac {n!}{k!(n-k)!}}}

binomni koeficijent,[1] po kome je raspodela dobila ime. Formula se može razumeti na sledeći način. k uspeha se javlja sa verovatnoćom pk i n − k neuspeha se javlja sa verovatnoćom (1 − p)n − k. Međutim, k uspeha se može javiti bilo gde među n pokušaja, i postoji ( n k ) {\displaystyle {\binom {n}{k}}} različitih načina raspodeljivanja k uspeha u nizu od n pokušaja.

Pri stvaranju referentnih tabela za verovatnoću binomne distribucije, obično se tabela popunjava do n/2 vrednosti. To je zato što se za k > n/2, verovatnoća može izračunati njenim komplementom kao

f ( k , n , p ) = f ( n k , n , 1 p ) . {\displaystyle f(k,n,p)=f(n-k,n,1-p).}

Gledajući izraz f(knp) kao funkciju od k, postoji k vrednosti koje je maksimiziraju. Stoga se k vrednost može naći izračunavajući

f ( k + 1 , n , p ) f ( k , n , p ) = ( n k ) p ( k + 1 ) ( 1 p ) {\displaystyle {\frac {f(k+1,n,p)}{f(k,n,p)}}={\frac {(n-k)p}{(k+1)(1-p)}}}

i upoređujući tu vrednost sa 1. Uvek postoji ceo broj M koji zadovoljava

( n + 1 ) p 1 M < ( n + 1 ) p . {\displaystyle (n+1)p-1\leq M<(n+1)p.}

f(knp) je monotono rastući za k < M i monotono opadajući za k > M, uz izuzetak slučaja gde je (n + 1)p ceo broj. U tom slučaju, postoje dve vrednosti za koje je f maksimalno: (n + 1)p i (n + 1)p − 1. M je najverovatniji ishod (mada još uvek može da bude sveukupno malo verovatan) Bernulijevih pokušaja i naziva se modus.[2][3][4][5]

Funkcija kumulativne verovatnoće

Funkcija kumulativne verovatnoće se može izraziti kao:[6]

F ( k ; n , p ) = Pr ( X k ) = i = 0 k ( n i ) p i ( 1 p ) n i {\displaystyle F(k;n,p)=\Pr(X\leq k)=\sum _{i=0}^{\lfloor k\rfloor }{n \choose i}p^{i}(1-p)^{n-i}}

gde je k {\displaystyle \lfloor k\rfloor \,} „pod” ispod k, i.e. najveći ceo broj manji od ili jedna sa k.

On se može predstaviti u vidu regulisane nekompletne beta funkcije,[7][8] na sledeći način:[9]

F ( k ; n , p ) = Pr ( X k ) = I 1 p ( n k , k + 1 ) = ( n k ) ( n k ) 0 1 p t n k 1 ( 1 t ) k d t . {\displaystyle {\begin{aligned}F(k;n,p)&=\Pr(X\leq k)\\&=I_{1-p}(n-k,k+1)\\&=(n-k){n \choose k}\int _{0}^{1-p}t^{n-k-1}(1-t)^{k}\,dt.\end{aligned}}}

Neki granični slučajevi zatvorenog oblika za funkciju kumulativne distribucije dati su u nastavku.

Primer

Pretpostavka je da se pristranim bacanjem novčića dobija glava sa verovatnoćom 0,3. Pitanje je: koja je verovatnoća postizanja 0, 1, ..., 6 glava posle šest bacanja?

Pr ( 0  heads ) = f ( 0 ) = Pr ( X = 0 ) = ( 6 0 ) 0.3 0 ( 1 0.3 ) 6 0 = 0.117649 {\displaystyle \Pr(0{\text{ heads}})=f(0)=\Pr(X=0)={6 \choose 0}0.3^{0}(1-0.3)^{6-0}=0.117649}
Pr ( 1  heads ) = f ( 1 ) = Pr ( X = 1 ) = ( 6 1 ) 0.3 1 ( 1 0.3 ) 6 1 = 0.302526 {\displaystyle \Pr(1{\text{ heads}})=f(1)=\Pr(X=1)={6 \choose 1}0.3^{1}(1-0.3)^{6-1}=0.302526}
Pr ( 2  heads ) = f ( 2 ) = Pr ( X = 2 ) = ( 6 2 ) 0.3 2 ( 1 0.3 ) 6 2 = 0.324135 {\displaystyle \Pr(2{\text{ heads}})=f(2)=\Pr(X=2)={6 \choose 2}0.3^{2}(1-0.3)^{6-2}=0.324135}
Pr ( 3  heads ) = f ( 3 ) = Pr ( X = 3 ) = ( 6 3 ) 0.3 3 ( 1 0.3 ) 6 3 = 0.18522 {\displaystyle \Pr(3{\text{ heads}})=f(3)=\Pr(X=3)={6 \choose 3}0.3^{3}(1-0.3)^{6-3}=0.18522}
Pr ( 4  heads ) = f ( 4 ) = Pr ( X = 4 ) = ( 6 4 ) 0.3 4 ( 1 0.3 ) 6 4 = 0.059535 {\displaystyle \Pr(4{\text{ heads}})=f(4)=\Pr(X=4)={6 \choose 4}0.3^{4}(1-0.3)^{6-4}=0.059535}
Pr ( 5  heads ) = f ( 5 ) = Pr ( X = 5 ) = ( 6 5 ) 0.3 5 ( 1 0.3 ) 6 5 = 0.010206 {\displaystyle \Pr(5{\text{ heads}})=f(5)=\Pr(X=5)={6 \choose 5}0.3^{5}(1-0.3)^{6-5}=0.010206}
Pr ( 6  heads ) = f ( 6 ) = Pr ( X = 6 ) = ( 6 6 ) 0.3 6 ( 1 0.3 ) 6 6 = 0.000729 {\displaystyle \Pr(6{\text{ heads}})=f(6)=\Pr(X=6)={6 \choose 6}0.3^{6}(1-0.3)^{6-6}=0.000729} [10]

Očekivanje

Ako je X ~ B(n, p), drugim rečima, X je binomno distribuirana randomna promenljiva, pri čemu je n ukupan broj eksperimenata, a p je verovatnoća svakog eksperimenta da proizvede uspešan rezultat, onda je očekivana vrednost X:[11]

E [ X ] = n p . {\displaystyle \operatorname {E} [X]=np.}

Na primer, ako je n = 100, i p = 1/4, onda je prosečan broj uspešnih rezultata 25.

Proof: Srednja vrednost, μ, se direktno izračunava po definiciji

μ = i = 0 n x i p i , {\displaystyle \mu =\sum _{i=0}^{n}x_{i}p_{i},}

i binomnoj teoremi:

μ = k = 0 n k ( n k ) p k ( 1 p ) n k = n p k = 0 n k ( n 1 ) ! ( n k ) ! k ! p k 1 ( 1 p ) ( n 1 ) ( k 1 ) = n p k = 1 n ( n 1 ) ! ( ( n 1 ) ( k 1 ) ) ! ( k 1 ) ! p k 1 ( 1 p ) ( n 1 ) ( k 1 ) = n p k = 1 n ( n 1 k 1 ) p k 1 ( 1 p ) ( n 1 ) ( k 1 ) = n p = 0 n 1 ( n 1 ) p ( 1 p ) ( n 1 ) sa  := k 1 = n p = 0 m ( m ) p ( 1 p ) m sa  m := n 1 = n p ( p + ( 1 p ) ) m = n p {\displaystyle {\begin{aligned}\mu &=\sum _{k=0}^{n}k{\binom {n}{k}}p^{k}(1-p)^{n-k}\\&=np\sum _{k=0}^{n}k{\frac {(n-1)!}{(n-k)!k!}}p^{k-1}(1-p)^{(n-1)-(k-1)}\\&=np\sum _{k=1}^{n}{\frac {(n-1)!}{((n-1)-(k-1))!(k-1)!}}p^{k-1}(1-p)^{(n-1)-(k-1)}\\&=np\sum _{k=1}^{n}{\binom {n-1}{k-1}}p^{k-1}(1-p)^{(n-1)-(k-1)}\\&=np\sum _{\ell =0}^{n-1}{\binom {n-1}{\ell }}p^{\ell }(1-p)^{(n-1)-\ell }&&{\text{sa }}\ell :=k-1\\&=np\sum _{\ell =0}^{m}{\binom {m}{\ell }}p^{\ell }(1-p)^{m-\ell }&&{\text{sa }}m:=n-1\\&=np(p+(1-p))^{m}\\&=np\end{aligned}}}

Srednja vrednost se može izvesti iz jednačine X = X 1 + + X n {\displaystyle X=X_{1}+\cdots +X_{n}} gde su sve randomne promenljive X i {\displaystyle X_{i}} obuhvaćene Bernulijevom raspodelom sa E [ X i ] = p {\displaystyle E[X_{i}]=p} ( X i = 1 {\displaystyle X_{i}=1} ako i-ti eksperiment uspe, dok je inače X i = 0 {\displaystyle X_{i}=0} ). Dobija se: E [ X ] = E [ X 1 + + X n ] = E [ X 1 ] + + E [ X n ] = p + + p n  puta = n p {\displaystyle E[X]=E[X_{1}+\cdots +X_{n}]=E[X_{1}]+\cdots +E[X_{n}]=\underbrace {p+\cdots +p} _{n{\text{ puta}}}=np}

Varijansa

Varijansa je:

Var ( X ) = n p ( 1 p ) . {\displaystyle \operatorname {Var} (X)=np(1-p).}

Dokaz: Neka je X = X 1 + + X n {\displaystyle X=X_{1}+\cdots +X_{n}} gde su sve X i {\displaystyle X_{i}} nezavisne randomne promenljive Bernulijeve raspodele. Kako je Var ( X i ) = p ( 1 p ) {\displaystyle \operatorname {Var} (X_{i})=p(1-p)} , dobija se:

Var ( X ) = Var ( X 1 + + X n ) = Var ( X 1 ) + + Var ( X n ) = n Var ( X 1 ) = n p ( 1 p ) . {\displaystyle \operatorname {Var} (X)=\operatorname {Var} (X_{1}+\cdots +X_{n})=\operatorname {Var} (X_{1})+\cdots +\operatorname {Var} (X_{n})=n\operatorname {Var} (X_{1})=np(1-p).}

Reference

  1. ^ Lilavati Section 6, Chapter 4 (see Knuth (1997)).
  2. ^ „AP Statistics Review - Density Curves and the Normal Distributions”. Архивирано из оригинала 02. 04. 2015. г. Приступљено 16. 3. 2015. 
  3. ^ „Relationship between the mean, median, mode, and standard deviation in a unimodal distribution”. 
  4. ^ Hippel, Paul T. von (2005). „Mean, Median, and Skew: Correcting a Textbook Rule”. Journal of Statistics Education. 13 (2). doi:10.1080/10691898.2005.11910556. Архивирано из оригинала 14. 10. 2008. г. Приступљено 15. 08. 2019. 
  5. ^ Bottomley, H. (2004). „Maximum distance between the mode and the mean of a unimodal distribution” (PDF). Unpublished preprint. 
  6. ^ Park, Kun Il (2018). Fundamentals of Probability and Stochastic Processes with Applications to Communications. Springer. ISBN 978-3-319-68074-3. 
  7. ^ Zelen, M.; Severo, N. C. (1972), „26. Probability functions”, Ур.: Abramowitz, Milton; Stegun, Irene A., Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables, New York: Dover Publications, стр. 925—995, ISBN 978-0-486-61272-0 
  8. ^ Davis, Philip J. (1972), „6. Gamma function and related functions”, Ур.: Abramowitz, Milton; Stegun, Irene A., Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables, New York: Dover Publications, ISBN 978-0-486-61272-0 
  9. ^ Wadsworth, G. P. (1960). Introduction to Probability and Random Variables. New York: McGraw-Hill. стр. 52. 
  10. ^ Hamilton Institute. "The Binomial Distribution" October 20, 2010.
  11. ^ See Proof Wiki

Literatura

  • Hirsch, Werner Z. (1957). „Binomial Distribution—Success or Failure, How Likely Are They?”. Introduction to Modern Statistics. New York: MacMillan. стр. 140—153. 
  • Neter, John; Wasserman, William; Whitmore, G. A. (1988). Applied Statistics (Third изд.). Boston: Allyn & Bacon. стр. 185–192. ISBN 0-205-10328-6. 
  • Ash, Robert B. (1990) [1965]. Information Theory. Dover Publications, Inc. ISBN 0-486-66521-6. 
  • Benjamin, Arthur T.; Quinn, Jennifer J. (2003). Proofs that Really Count: The Art of Combinatorial Proof. Dolciani Mathematical Expositions. 27. Mathematical Association of America. ISBN 978-0-88385-333-7. 
  • Bryant, Victor (1993). Aspects of combinatorics. Cambridge University Press. ISBN 0-521-41974-3. 
  • Flum, Jörg; Grohe, Martin (2006). Parameterized Complexity Theory. Springer. ISBN 978-3-540-29952-3. Архивирано из оригинала 18. 11. 2007. г. Приступљено 15. 08. 2019. 
  • Fowler, David (januar 1996). „The Binomial Coefficient Function”. The American Mathematical Monthly. Mathematical Association of America. 103 (1): 1—17. JSTOR 2975209. doi:10.2307/2975209. 
  • Goetgheluck, P. (1987). „Computing Binomial Coefficients”. American Mathematical Monthly. 94: 360—365. doi:10.2307/2323099. 
  • Graham, Ronald L.; Knuth, Donald E.; Patashnik, Oren (1994). Concrete Mathematics (Second изд.). Addison-Wesley. стр. 153–256. ISBN 0-201-55802-5. 
  • Gradshteyn, I. S.; Ryzhik, I. M. (2014). Table of Integrals, Series, and Products (8th изд.). Academic Press. ISBN 978-0-12-384933-5. 
  • Grinshpan, A. Z. (2010), „Weighted inequalities and negative binomials”, Advances in Applied Mathematics, 45 (4): 564—606, doi:10.1016/j.aam.2010.04.004 
  • Higham, Nicholas J. (1998). Handbook of writing for the mathematical sciences. SIAM. стр. 25. ISBN 0-89871-420-6. 
  • Knuth, Donald E. (1997). The Art of Computer Programming, Volume 1: Fundamental Algorithms (Third изд.). Addison-Wesley. стр. 52—74. ISBN 0-201-89683-4. 
  • Singmaster, David (1974). „Notes on binomial coefficients. III. Any integer divides almost all binomial coefficients”. Journal of the London Mathematical Society. 8 (3): 555—560. doi:10.1112/jlms/s2-8.3.555. 
  • Shilov, G. E. (1977). Linear algebra. Dover Publications. ISBN 978-0-486-63518-7. 

Spoljašnje veze

Binomna raspodela na Vikimedijinoj ostavi.
  • Interactive graphic: Univariate Distribution Relationships
  • Binomial distribution formula calculator
  • Difference of two binomial variables: X-Y
  • Querying the binomial probability distribution in WolframAlpha
  • Hazewinkel Michiel, ур. (2001). „Binomial coefficients”. Encyclopaedia of Mathematics. Springer. ISBN 978-1556080104. 
  • Andrew Granville (1997). „Arithmetic Properties of Binomial Coefficients I. Binomial coefficients modulo prime powers”. CMS Conf. Proc. 20: 151—162. Архивирано из оригинала 23. 09. 2015. г. Приступљено 15. 08. 2019. 
Normativna kontrola: Državne Уреди на Википодацима
  • Nemačka
  • Izrael
  • Sjedinjene Države
  • Letonija
  • Češka