La distribuzione ipergeometrica è una distribuzione di probabilità discreta che può essere paragonata all'estrazione senza reimmissione da un'urna contenenti palline rosse e nere di cui si conosce esattamente il numero.
Vedremo adesso la formula che ci consentirà di calcolare la probabilità di una variabile aleatoria con distribuzione ipergeometrica.
Una domanda sorge spontanea: come fare a capire dal testo dell'esercizio che la variabile aleatoria in questione ha distribuzione ipergeometrica?
Seguiamo i seguenti passi. Indichiamo con
- $M$ la popolazione (il numero di palline totali presenti nell'urna)
- $k$ il numero di unità con una data caratteristica (ad esempio il numero di palline rosse)
- $n$ campione estratto senza reimmissione (numero di palline estratte)
Inoltre sia $X$ la variabile aleatoria che denota il numero di palline estratte aventi la data caratteristica.
Sotto queste ipotesi, la variabile aleatoria $X$ ha distribuzione ipergeometrica di parametri $M$, $k$ e $n$; in simboli: $$X\sim H(M,k,n)$$
In tal caso, la probabilità che $X$ assuma un certo valore $x$ (ossia la probabilità di estrarre senza restituzione esattamente $x$ palline rosse) è data da: $$\bbox[#ffffff,5px,border:2px solid #ff6600]{P(X=x)=\frac{{k\choose {x}}{{M-k}\choose {n-x}}}{{{M}\choose {n}}}}$$
Esempio
Un sacchetto contiene 10 palline bianche e 5 rosse. Una persona estrae 5 palline a caso, ogni volta senza reinserire la pallina estratta nel sacchetto. Quanto vale la probabilità di pescare almeno 3 palline rosse?
In questo caso abbiamo che:
- il numero di palline totali presenti nell'urna è $M=15
- il numero di palline aventi la caratteristica cercata (quelle rosse) è $k=5$
- il numero di palline estrasse senza restituzione è $n=5$
- la variabile aleatoria $X$, infine, indica il numero di palline aventi la data caratteristica (quelle rosse) tra tutte quelle estratte e, per un dato valore $x$, risulta $$P(X=x)=\frac{{{5}\choose {x}}{{10}\choose {5-x}}}{{{15}\choose{5}}}$$
La probabilità cercata è dunque $$\begin{eqnarray} P(X\geq 3)&=&1-P(X\leq 2)=\\ &=& 1-[P(X=0)+P(X=1)+P(X=2)]=\\ &=& 1-\left[\frac{{{5}\choose {0}}{{10}\choose {5}}}{{{15}\choose{5}}}+\frac{{{5}\choose {1}}{{10}\choose {4}}}{{{15}\choose{5}}}+\frac{{{5}\choose {2}}{{10}\choose {3}}}{{{15}\choose{5}}}\right]=\\ &=& 1-[0.0839+0.3497+0.3996]=0.1668 \end{eqnarray}$$