Distribuzione binomiale

Distribuzione binomiale B ( n , p ) {\displaystyle {\mathcal {B}}(n,p)}
Funzione di distribuzione discreta
Funzione di probabilità
Funzione di ripartizione
Funzione di ripartizione
Parametri p [ 0 , 1 ] q = 1 p n N {\displaystyle {\begin{array}{l}p\in [0,1]\\q=1-p\\n\in \mathbb {N} \end{array}}}
Supporto { 0 , 1 , , n }   {\displaystyle \{0,1,\dotsc ,n\}\ }
Funzione di densità ( n k ) p k q n k {\displaystyle \textstyle {n \choose k}p^{k}q^{n-k}}
Funzione di ripartizione I q ( n k , k + 1 ) {\displaystyle I_{q}(n-k,k+1)}
(funzione Beta incompleta regolarizzata)
Valore atteso n p   {\displaystyle np\ }
Medianatra n p {\displaystyle \lfloor np\rfloor } e n p {\displaystyle \lceil np\rceil }
(non precisa)
Moda [ p ( n + 1 ) ] {\displaystyle [p(n+1)]} se p ( n + 1 ) N {\displaystyle p(n+1)\not \in \mathbb {N} }
Varianza n p ( 1 p )   {\displaystyle np(1-p)\ }
Indice di asimmetria q p n p q {\displaystyle {\frac {q-p}{\sqrt {npq}}}}
Curtosi 1 6 p q n p q {\displaystyle {\frac {1-6pq}{npq}}}
Funzione generatrice dei momenti ( q + p e t ) n   {\displaystyle (q+pe^{t})^{n}\ }
Funzione caratteristica ( q + p e i t ) n   {\displaystyle (q+pe^{it})^{n}\ }
Manuale

In teoria della probabilità la distribuzione binomiale è una distribuzione di probabilità discreta che descrive il numero di successi in un processo di Bernoulli, ovvero la variabile aleatoria S n = X 1 + X 2 + + X n {\displaystyle S_{n}=X_{1}+X_{2}+\dotsb +X_{n}} che somma n {\displaystyle n} variabili aleatorie indipendenti di uguale distribuzione di Bernoulli B ( p ) {\displaystyle {\mathcal {B}}(p)} .

Esempi di casi di distribuzione binomiale sono i risultati di una serie di lanci di una stessa moneta o di una serie di estrazioni da un'urna (con reintroduzione), ognuna delle quali può fornire due soli risultati: il successo con probabilità p {\displaystyle p} e il fallimento con probabilità q = 1 p {\displaystyle q=1-p} .

Definizione

In sostanza, una variabile o processo può essere definito binomiale se rispetta tutti i seguenti criteri[1]:

  • il risultato di ogni evento può essere considerato di due sole tipologie: positivo o negativo, + o -, bianco o nero, successo o fallimento, ecc...
  • ciascun evento è indipendente da tutti gli altri possibili
  • il processo o variabile assume un determinato e fissato numero intero di valori
  • la probabilità di successo/fallimento di ogni evento è costante

La distribuzione binomiale B ( n , p ) {\displaystyle {\mathcal {B}}(n,p)} è caratterizzata da due parametri:[2]

  • n {\displaystyle n} : il numero di prove effettuate.
  • p {\displaystyle p} : la probabilità di successo della singola prova di Bernoulli X i {\displaystyle X_{i}} (con 0 p 1 {\displaystyle 0\leq p\leq 1} ).

Per semplicità di notazione viene solitamente utilizzato anche il parametro q = 1 p {\displaystyle q=1-p} , che esprime la probabilità di fallimento per una singola prova.

La distribuzione di probabilità è:

P ( k ) = P ( X 1 + X 2 + + X n = k ) = ( n k ) p k q n k {\displaystyle P(k)=P(X_{1}+X_{2}+\dotsb +X_{n}=k)={\binom {n}{k}}p^{k}q^{n-k}}

cioè ogni successione con k {\displaystyle k} successi e n k {\displaystyle n-k} insuccessi ha probabilità p k q n k {\displaystyle p^{k}q^{n-k}} , mentre il numero di queste successioni, pari al numero di modi (o combinazioni) in cui possono essere disposti i k {\displaystyle k} successi negli n {\displaystyle n} tentativi, è dato dal coefficiente binomiale ( n k ) = n ! k ! ( n k ) ! {\displaystyle \textstyle {\binom {n}{k}}={\frac {n!}{k!(n-k)!}}} .

La formula del binomio di Newton mostra come la somma di tutte le probabilità nella distribuzione sia uguale a 1 {\displaystyle 1} :

k = 0 n P ( S n = k ) = k = 0 n ( n k ) p k q n k = ( p + q ) n = ( p + 1 p ) n = ( 1 ) n = 1 {\displaystyle \sum _{k=0}^{n}P(S_{n}=k)=\sum _{k=0}^{n}{\binom {n}{k}}p^{k}q^{n-k}=(p+q)^{n}=(p+1-p)^{n}=(1)^{n}=1}

Esempio

Per calcolare la probabilità di ottenere con 5 lanci di un dado (equilibrato a 6 facce) esattamente 3 volte "4", basta considerare i lanci come un processo di Bernoulli.

Ogni singola prova ha probabilità p=1/6 di ottenere "4" (successo) e probabilità q=5/6 di non ottenerlo (insuccesso). Il numero di successi con 5 prove è allora descritto da una variabile aleatoria S5 di legge B(5,1/6).

La probabilità di ottenere esattamente 3 volte "4" con 5 lanci (e 2 volte "non 4") è

P ( S 5 = 3 ) = ( 5 3 ) ( 1 / 6 ) 3   ( 5 / 6 ) 2 = 10 ( 1 / 6 ) 3 ( 5 / 6 ) 2 = 0,032 {\displaystyle P(S_{5}=3)={\binom {5}{3}}(1/6)^{3}\ (5/6)^{2}=10(1/6)^{3}(5/6)^{2}=0{,}032\dotso }

Caratteristiche

Siccome la distribuzione binomiale B ( n , p ) {\displaystyle {\mathcal {B}}(n,p)} descrive una variabile aleatoria S n {\displaystyle S_{n}} definita come la somma di n {\displaystyle n} variabili aleatorie indipendenti X i {\displaystyle X_{i}} di uguale legge di Bernoulli B ( p ) {\displaystyle {\mathcal {B}}(p)} , molte caratteristiche di S n {\displaystyle S_{n}} possono essere ricavate da quelle di X {\displaystyle X} :

E [ S n ] = i = 1 n E [ X i ] = n E [ X ] = n p {\displaystyle E[S_{n}]=\sum _{i=1}^{n}E[X_{i}]=nE[X]=np}
Var ( S n ) = i = 1 n Var ( X i ) = n Var ( X ) = n p q {\displaystyle {\text{Var}}(S_{n})=\sum _{i=1}^{n}\operatorname {Var} (X_{i})=n\operatorname {Var} (X)=npq}
g ( S n , t ) = i = 1 n g ( X i , t ) = g ( X , t ) n = ( q + p e t ) n {\displaystyle g(S_{n},t)=\prod _{i=1}^{n}g(X_{i},t)=g(X,t)^{n}=(q+pe^{t})^{n}}
  • la funzione caratteristica
ϕ S n ( t ) = i = 1 n ϕ X i ( t ) = ϕ X ( t ) n = ( q + p e i t ) n {\displaystyle \phi _{S_{n}}(t)=\prod _{i=1}^{n}\phi _{X_{i}}(t)=\phi _{X}(t)^{n}=(q+pe^{it})^{n}}
  • il coefficiente di skewness
γ 1 = q p n p q {\displaystyle \gamma _{1}={\frac {q-p}{\sqrt {npq}}}}
γ 2 = 1 n ( 1 p q 6 ) {\displaystyle \gamma _{2}={\frac {1}{n}}\left({\frac {1}{pq}}-6\right)}

La moda di S n {\displaystyle S_{n}} si ottiene confrontando le probabilità successive P ( k + 1 ) / P ( k ) {\displaystyle P(k+1)/P(k)} . Se p ( n + 1 ) {\displaystyle p(n+1)} è un numero intero allora P ( p ( n + 1 ) ) = P ( p ( n + 1 ) 1 ) {\displaystyle P(p(n+1))=P(p(n+1)-1)} e la moda non è unica; se invece p ( n + 1 ) {\displaystyle p(n+1)} non è un intero allora la moda è pari alla sua parte intera [ p ( n + 1 ) ] {\displaystyle [p(n+1)]} .

Non esistono formule precise per la mediana di S n {\displaystyle S_{n}} , che tuttavia dev'essere compresa tra le parti intere inferiore e superiore di n p {\displaystyle np} , n p {\displaystyle \lfloor np\rfloor } e n p {\displaystyle \lceil np\rceil } . Se n p {\displaystyle np} è un intero allora la mediana è n p {\displaystyle np} . Se la funzione di ripartizione assume il valore 1 / 2 {\displaystyle 1/2} (ad esempio F ( k ) = 1 / 2 {\displaystyle F(k)=1/2} per p = 1 / 2 {\displaystyle p=1/2} ed n = 2 k + 1 {\displaystyle n=2k+1} dispari) allora tutti i valori dell'intervallo possono essere presi come mediana.

Altre distribuzioni di probabilità

La distribuzione di Bernoulli B ( p ) {\displaystyle {\mathcal {B}}(p)} può essere considerata come un caso particolare di distribuzione binomiale B ( 1 , p ) {\displaystyle {\mathcal {B}}(1,p)} , che descrive un processo di Bernoulli con una sola prova: S 1 = X 1 {\displaystyle S_{1}=X_{1}} .

Gli insuccessi in una sequenza di estrazioni da un'urna in un processo di Bernoulli sono descritti da una variabile aleatoria che segue la distribuzione di Pascal, un caso limite della quale è la distribuzione geometrica.

I successi in una sequenza di estrazioni da un'urna, eseguite senza reintroduzione degli estratti, sono descritti da una variabile aleatoria che segue la legge ipergeometrica.

Convergenze

Per valori di n {\displaystyle n} sufficientemente grandi la legge binomiale è approssimata da altre leggi.

Quando n {\displaystyle n} tende a infinito, lasciando fisso λ = n p {\displaystyle \lambda =np} , la distribuzione binomiale tende alla distribuzione di Poisson P ( λ ) = P ( n p ) {\displaystyle P(\lambda )=P(np)} . In statistica quest'approssimazione viene solitamente accettata quando n 20 {\displaystyle n\geq 20} e p 1 / 20 {\displaystyle p\leq 1/20} , oppure quando n 100 {\displaystyle n\geq 100} e n p 10 {\displaystyle np\leq 10} .

Per il teorema del limite centrale, quando n {\displaystyle n} tende a infinito, lasciando fisso p {\displaystyle p} , la distribuzione binomiale tende alla distribuzione normale N ( n p , n p q ) {\displaystyle N(np,npq)} , di media n p {\displaystyle np} e varianza n p q {\displaystyle npq} . In statistica quest'approssimazione viene solitamente accettata quando n p > 5 {\displaystyle np>5} e n q > 5 {\displaystyle nq>5} .

Più precisamente, il teorema del limite centrale afferma che

lim n S n E [ S n ] Var ( S n ) = lim n S n n p n p q = N ( 0 , 1 ) {\displaystyle \lim _{n\to \infty }{\frac {S_{n}-E[S_{n}]}{\sqrt {\operatorname {Var} (S_{n})}}}=\lim _{n\to \infty }{\frac {S_{n}-np}{\sqrt {npq}}}={\mathcal {N}}(0,1)}

Generalizzazioni

Una generalizzazione della distribuzione binomiale B ( p , n ) {\displaystyle {\mathcal {B}}(p,n)} è la legge distribuzione Beta-binomiale B ( a , b , n ) {\displaystyle \mathrm {B} (a,b,n)} , che descrive la somma S n = X 1 + X 2 + + X n {\displaystyle S_{n}=X_{1}+X_{2}+\dotsb +X_{n}} di n {\displaystyle n} variabili aleatorie indipendenti, ognuna con distribuzione di Bernoulli B ( P ) {\displaystyle {\mathcal {B}}(P)} , dove P {\displaystyle P} segue la legge Beta B ( a , b ) {\displaystyle \mathrm {B} (a,b)} . (Al contrario della distribuzione binomiale, le X i {\displaystyle X_{i}} non hanno lo stesso parametro.)

La distribuzione binomiale è una delle quattro distribuzioni di probabilità definite dalla ricorsione di Panjer: P ( k ) = ( p q + 1 k ( n + 1 ) p q ) P ( k 1 ) {\displaystyle P(k)=(-{\tfrac {p}{q}}+{\tfrac {1}{k}}{\tfrac {(n+1)p}{q}})P(k-1)} .

Statistica

Nell'inferenza bayesiana si utilizzano particolari relazioni tra la distribuzione binomiale e altre distribuzioni di probabilità.

Se P {\displaystyle P} è una variabile aleatoria che segue la distribuzione Beta B ( a , b ) {\displaystyle \mathrm {B} (a,b)} e S n {\displaystyle S_{n}} è una variabile aleatoria con distribuzione binomiale B ( p , n ) {\displaystyle {\mathcal {B}}(p,n)} , allora la probabilità condizionata da S n = x {\displaystyle S_{n}=x} per P {\displaystyle P} segue la distribuzione Beta B ( a + x , b + n x ) {\displaystyle \mathrm {B} (a+x,b+n-x)} . In altri termini, la distribuzione Beta descrive P {\displaystyle P} sia a priori che a posteriori di S n = x {\displaystyle S_{n}=x} .

In particolare la distribuzione continua uniforme sull'intervallo [ 0 , 1 ] {\displaystyle [0,1]} è un caso particolare di distribuzione Beta B ( 1 , 1 ) {\displaystyle \mathrm {B} (1,1)} , quindi la distribuzione per P {\displaystyle P} , a posteriori di S n = x {\displaystyle S_{n}=x} , segue la legge Beta B ( x + 1 , n x + 1 ) {\displaystyle \mathrm {B} (x+1,n-x+1)} , che per inciso ha un massimo in x / n {\displaystyle x/n} .

Note

  1. ^ Khan Academy, Corso su Binomial random variables, lezione Recognizing binomial variables
  2. ^ Ross, p. 146.

Bibliografia

  • Sheldon M. Ross, Probabilità e statistica per l'ingegneria e le scienze, Trento, Apogeo, 2003, ISBN 88-7303-897-2.

Voci correlate

Altri progetti

Altri progetti

  • Wikimedia Commons
  • Collabora a Wikimedia Commons Wikimedia Commons contiene immagini o altri file su distribuzione binomiale

Collegamenti esterni

  • (EN) Richard Routledge, binomial distribution, su Enciclopedia Britannica, Encyclopædia Britannica, Inc. Modifica su Wikidata
  • (EN) Eric W. Weisstein, Distribuzione binomiale, su MathWorld, Wolfram Research. Modifica su Wikidata
  • Calcolatrice online - Distribuzione binomiale, su elektro-energetika.cz.
Controllo di autoritàLCCN (EN) sh85014113 · GND (DE) 4145587-3 · J9U (ENHE) 987007282570105171
  Portale Matematica
  Portale Statistica