Webtudordimatematica

Distribuzione normale

La distribuzione continua di gran lunga più usata è la distribuzione normale o di Gauss (nome dell'inventore).

Il termine distribuzione normale deriva dalla convizione (non del tutto corretta) che gli errori accidentali o casuali, commessi effettuando misure ripetute, si distribuiscano secondo tale curva.

Questa distribuzione, è particolarmente importante sia perchè risulta utile in numerose applicazioni pratiche, sia perchè può sovente essere utilizzata come distribuzione limite in quanto è una distribuzione alla quale tendono altre distribuzioni sotto condizioni abbastanza generali. Quest'ultima caratteristica viene messa in evidenza nel famoso Teorema del Limite Centrale.

Una variabile aleatoria continua $X$ con media $\mu$ e scarto quadratico medio $\sigma$ ha distribuzione normale (e si indica con $X\sim N(\mu,\sigma)$) se la sua funzione di densità è:

$$\bbox[#ffffff,5px,border:2px solid #ff6600]{f(x)=\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}}$$

Qui in basso è rappresentato il suo grafico.

Curva di Gauss: curva della distribuzione normale

Le caratteristiche fondamentali della curva di Gauss $f(x)$ sono:

  • la forma a campana;
  • la simmetria rispetto al valor medio $\mu$;
  • il massimo per $x=\mu$, dove l'ordinata corrisponde a $\frac{1}{\sqrt{2\pi}}$;
  • i punti $\mu-\sigma$ e $\mu+\sigma$ sono punti di flesso
  • Quanto più $x$ si allontana da $\mu$ tanto più $f(x)$ decresce e tende asintoticamente a zero.

$\mu$ viene anche indicato come centro della distribuzione e caratterizza la posizione della curva sull'asse delle ascisse: al variare di $\mu$ la curva si sposta lungo l'asse $x$, ma resta invariata nella sua forma.

Variazione della curva di Gauss al variare del valor medio

Il parametro $\sigma$, invece, caratterizza la forma della curva, in quanto è una misura della dispersione dei valori attorno al valore medio: al variare di $\sigma$ la curva cambia forma: infatti al crescere di $\sigma$ la curva si appiattisce e si allarga, mentre al diminuire di $\sigma$ la curva si restringe e si alza.

Variazione della curva di Gauss al variare dello scarto quadratico medio

La funzione di distribuzione o funzione di ripartizione normale è data da:

$$\bbox[#ffffff,5px,border:2px solid #ff6600]{F(x)=P(X\le x)=\frac{1}{\sigma\sqrt{2\pi}}\int_{-\infty}^xe^{-\frac{1}{2}\left(\frac{t-\mu}{\sigma}\right)^2}\ dt}$$

Distribuzione normale standard

Per determinare la probabilità che la variabile aleatoria normale assuma un valore compreso in un determinato intervallo $(a,b)$ è necessario calcolare l'area sotto la curva compresa tra $a$ e $b$ (vedi figura in basso).

Distribuzione normale standard

Questo significherebbe calcolare il seguente integrale:

$$P(a\le X\le b)=\int_a^b f(x)\ dx=\int_a^b \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}\ dx$$

che riscritto in termini di funzione di ripartizione diventa:

$$P(a\le X\le b)=F(b)-F(a)$$

Ma questo integrale non è affatto semplice e risulta essere un calcolo troppo dispendioso per la risoluzione di esercizi sulla probabilità di variabili normali.

Per ovviare a ciò, si è pensato di tabulare i valori della funzione di ripartizione (e quindi dell'area sotto la curva) su un'unica tavola numerica. Questo è stato possibile introducendo la seguente trasformazione detta standardizzazione della variabile normale $X$:

$$\bbox[#ffffff,5px,border:2px solid #ff6600]{Z=\frac{X-\mu}{\sigma}}$$

ottenendo, così, una variabile aleatoria normale standardizzata $Z$ con valor medio $E(Z)=\mu = 0$ e varianza $VAR(Z)=\sigma^2 = 1$ ($Z\sim N(0,1)$).

Inoltre, si ha:

$$f(z)=\frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}z^2}$$

e

$$F(z_0)=P(Z\le z_0)=\int_{-\infty}^{z_0} f(z)\ dz=\int_{-\infty}^{z_0}\frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}z^2}\ dz$$

Come si può vedere, la funzione di densità e la sua funzione di ripartizione, grazie alla trasformazione, dipendono da un'unica variabile $Z$, pertanto è stato possibile costruire una tavola numerica con i valori delle funzioni al variare di $Z$.

Tale tavola permette di determinare il valore della probabilità per qualsiasi intervallo. Vediamo come utilizzarle fornendo tutti gli esempi del caso.

Come leggere la tavola della distribuzione normale

Esempio 1

Calcolare la probabilità che la variabile standardizzata $Z$ sia minore di un numero positivo $z=1,6$

Dobbiamo determinare $P(Z\le 1,6)$ ovvero il valore della funzione di ripartizione $F(z=1,6)$. Leggiamo la tavola: nella prima colonna sono riportati la parte intera e la prima cifra decimale di $z$, mentre, nella prima riga, la seconda cifra decimale di $z$.

I valori della funzione di ripartizione sono riportati all'interno della tabella.

Per $z=1,6$ si procede nella colonna segnata $z$ fino a $1,6$ e poi si procede a destra e si legge il valore nella prima colonna (segnata 0).

Come leggere la tavola della distribuzione normale

La probabilità risulta:

$$F(Z=1,60)=P(Z\le 1,60)=0,9452$$

Questa probabilità è rappresentata nell'area ombreggiata nella figura qui sotto.

Probabilità che Z assume un valore minore di un numero positivo

Esempio 2

Calcolare la probabilità che la variabile standardizzata $Z$ sia maggiore di un numero positivo $z=0,65$

Dobbiamo calcolare $P(Z\ge 0,65)$. Poiché nella tavola sono tabulati soltanto i valori della funzione di ripartizione (ovvero le probabilità che $Z$ sia minore o uguale di un certo valore $z$), possiamo calcolare la probabilità richiesta osservando che:

$$P(Z\ge 0,65)=1-P(Z < 0,65)=1-F(Z=0,65) = 1- 0,7422= 0,2578$$

dove $F(Z=0,65)$ è stata calcolata come nel primo esempio già visto: procedendo nella colonna segnata da $z$ fino a $0,6$ e poi, procedendo a destra fino alla colonna segnata $5$, si legge il valore $0,7422$.

Come calcolare la probabilità di una distribuzione normale

La probabilità è rappresentata nella figura qui sotto.

Probabilità che Z assume un valore maggiore di un numero negativo

Esempio 3

Calcolare la probabilità che la variabile standardizzata $Z$ sia minore di un numero negativo $z=-1,12$

La probabilità cercata è rappresentata dall'area ombreggiata nella figura sotto.

Probabilità che Z assume un valore minore di un numero negativo

Dobbiamo trovare $P(Z < -1,12)$. Per determinare tale probabilità si può osservare che la curva è simmetrica rispetto al valore $z=0$, pertanto:

$$P(Z < -1,12)=P(Z > 1,12)$$

e dunque, per quello fatto nel secondo esempio:

$$P(Z > 1,12)=1-F(Z=1,12)=1-0,8686=0,1314$$

Esempio 4

Calcolare la probabilità che la variabile standardizzata $Z$ sia maggiore di un numero negativo $z=-0,93$

Dobbiamo trovare $P(Z > -0,93)$. Sempre grazie alla simmetria della curva rispetto al valore $z=0$, si ha:

$$P(Z > -0,93) = P(Z < 0,93)=0,8238$$

Probabilità che Z assume un valore maggiore di un numero negativo

Esempio 5

Calcolare la probabilità che la variabile standardizzata $Z$ sia compresa tra due valori $z_1=0,6$ e $z_2=1,3$

La probabilità cercata è $P(0,6 < Z < 1,3)$ ed è rappresentata dall'area ombreggiata nella figura qui sotto.

Probabilità che Z assume un valore compreso tra due numeri

Per determinare tale probabilità si può osservare che:

$$P(0,6 < Z < 1,3)=F(Z=1,3)-F(Z=0,6)=0,9032-0,7257=0,1775$$

dove i valori di $F(Z=1,3)$ e $F(Z=0,6)$ sono stati determinati leggendoli dalla tavola della distribuzione normale così come fatto negli esempi precedenti.

Per mezzo della trasformazione vista all'inizio di questo articolo

$$Z=\frac{X-\mu}{\sigma}$$

è possibile determinare la probabilità che una generica variabile aleatoria normale $X$, con media $\mu$ e deviazione standard $\sigma$ appartenga ad un intervallo $(a,b)$.

Facciamo subito qualche esempio.

Esempio 6

Sia $X$ una variabili aleatoria normalmente distribuita con media $\mu=10$ e deviazione standard $\sigma=3$. Determinare le seguenti probabilità:

  1. $P(X\le 13)$;
  2. $P(X\ge 14,5)$;
  3. $P(-6\le X\le 12)$.

Calcolo probabilità 1: per poter calcolare tale probabilità, occorre dapprima standardizzare la variabile $X$ e quindi il valore $x=13$:

$$P(X\le 13)=P\left(\frac{X-\mu}{\sigma}\le\frac{13-10}{3}\right)=P(Z\le 1)=F(Z=1)=0,8413$$

Il valore $F(Z=1)$ è stato letto sulla tavole della distribuzione normale come fatto precedentemente in questo articolo.

Calcolo probabilità 2:

$$P(X\ge 14,5)=P\left(Z\ge\frac{14,5-10}{3}\right)=P(Z\ge 1,5)=1-F(Z=1,5)=1-0,9332=0,0668$$

Calcolo probabilità 3:

$$\begin{array}{l} &P(-6\le X\le 12) = P\left(\frac{-6-10}{3}\le Z\le\frac{12-10}{3}\right)=\\ &=P(-5,33\le Z\le 0,67)=\\ &=P(Z\le 0,67)- P(Z\le -5,33)= \\ &=P(Z\le 0,67)-[1-P(Z\le 5,33)]=\\ &= F(Z=0,67)-1+F(Z=5,33)=\\ &=0,7794-1+1=0,7794\end{array}$$

Da notare che la $F(Z=5,33)\simeq 1$ poichè il valore $z=5,33$ si trova nell'estrema curva destra della distribuzione.

 

Vai agli esercizi

 

La distribuzione normale in Excel

Non sai come calcolare la distribuzione normale in Excel?  Qui di seguito l'elenco delle funzioni Excel disponibili:

Il quaderno degli appunti
Trigonometria

Teorema della corda, teorema delle proiezioni, teorema dei seni e dei coseni

Teorema della corda La misura di una corda di una circonferenza è uguale al prodotto tra la misura del diametro ed il seno di uno qualunque degli ang
Trigonometria

Teoremi relativi al triangolo rettangolo

Dato un triangolo rettangolo $ABC$, i valori dei cateti possono venir determinati mediante la misure dell'angolo acuto $\beta$ e dell'ipotenusa $c$.
Algebra di base

Radici algebriche

Esaminiamo il seguente problema: qual è il numero positivo che elevato al quadrato dà 9? Consideriamo di nuovo lo stesso problema, però nel campo d