NOTA! Questo sito utilizza i cookie e tecnologie simili.

Se non si modificano le impostazioni del browser, l'utente accetta. Per saperne di piu'

Approvo

Indici di dispersione o variabilità

Vediamo adesso alcuni indici significativi per la misura della variabilità di una distribuzione di frequenza.

I più importanti sono la varianza e lo scarto quadratico medio, detti anche indici di dispersione o indici di variabilità, perchè misurano la dispersione dei dati attorno alla media

Tra i meno importanti e utilizzati ci sono il campo di variazione, lo scostamento medio assoluto dalla media aritmetica e lo scostamento medio assoluto dalla mediana.

Varianza

Si definisce varianza, o varianza campionaria di un insieme di $n$ dati $x_1,x_2,\dots ,x_n$ con media $\overline{x}$, la quantità

$$\bbox[#fd7b01,5px,border:2px solid #fd7b01]{s^2=\frac{\sum\limits_{i=1}^n\left(x_i-\overline{x}\right)^2}{n-1}}$$

Si dimostra facilmente che la formula precedente, può essere riscritta come segue: $$s^2=\frac{\sum\limits_{i=1}^n x_i^2-n\overline{x}^2}{n-1}$$ la quale rappresenta la formula più utilizzata nella pratica per calcolare la varianza.

Scarto quadratico medio o deviazione standard

Si definisce scarto quadratico medio, o deviazione standard la radice quadrata della varianza

$$\bbox[#fd7b01,5px,border:2px solid #fd7b01]{s=\sqrt{\frac{\sum\limits_{i=1}^n\left(x_i-\overline{x}\right)^2}{n-1}}}$$

Analogamente a quanto detto per la varianza, la deviazione standard può essere calcolata utilizzando una formula più pratica $$s=\sqrt{\frac{\sum\limits_{i=1}^n x_i^2-n\overline{x}^2}{n-1}}$$

Varianza divisa per $n-1$ o per $n$?

Osserviamo che nella formula si divide per $n-1$ anzichè per $n$, perchè la varianza $s^2$ definita in questo modo gode di alcune proprietà che la rendono una misura più adeguata nell'inferenza statistica (intervalli di confidenza, test di ipotesi, ecc.).

Tuttavia, in alcuni casi, non si esclude la possibilità di calcolare la varianza dividendo nella formula per $n$.

Dalle formule esposte sopra, si evince come la varianza aumenti all'aumentare dello scostamento dei dati dal valore medio.

Varianza per dati raggruppati

Se i dati sono raggruppati in classi, analogamente al valore medio (vedi qui) è possibile calcolare la varianza. Supposti $n$ il numero totale di dati, $k$ le classi, $m_i$ il valore centrale della generica classe e $f_i$ la corrispondente frequenza assoluta, la varianza per gli $n$ dati raggruppati nelle $k$ classi è data da:

$$\bbox[#fd7b01,5px,border:2px solid #fd7b01]{s^2=\frac{\sum\limits_{i=1}^k\left(m_i-\overline{x}\right)^2f_i}{n-1}}$$

Per il calcolo della varianza per dati raggruppati si può utilizzare la seguente formula alternativa e più efficienti dal punto di vista computazionale: $$s^2=\frac{\sum\limits_{i=1}^k f_im_i^2-n\overline{x}^2}{n-1}$$

Esempio di calcolo della varianza per dati raggruppati in classi

In riferimento all'esempio precedente, calcoliamo la varianza utilizzando la formula appena vista: $$s^2=\frac{7^2\cdot 4+11^2\cdot 9+15^2\cdot 15+19^2\cdot 24+23^2\cdot 17+27^2\cdot 9+31^2\cdot 2-80\cdot 18.8^2}{79}=31.96$$

Scostamento medio assoluto dalla media

Lo scostamento medio assoluto di una distribuzione dalla media aritmetica $S(\overline{x})$ è una misura di variabilità che tiene conto di tutti i valori della distribuzione e si calcola in modo semplice facendo la media aritmetica degli scarti assoluti dei singoli dati dalla loro media.

Nel caso di $n$ dati non raggruppati si ha:

$$\bbox[#fd7b01,5px,border:2px solid #fd7b01]{S(\overline{x})=\frac{\sum\limits_{i=1}^n|x_i-\overline{x}|}{n}}$$

Nel caso di $n$ dati raggruppati in $k$ classi ciascuna con generica frequenza $f_i$:

$$\bbox[#fd7b01,5px,border:2px solid #fd7b01]{S(\overline{x})=\frac{\sum\limits_{i=1}^k|x_i-\overline{x}|f_i}{n}}$$

Scostamento medio assoluto dalla mediana

Quando si vuole calcolare lo scostamento medio assoluto rispetto alla mediana si procede in modo analogo a quanto fatto per la media aritmetica sostituendo la mediana $\widetilde{x}$ al posto del valor medio $\overline{x}$:

$$\bbox[#fd7b01,5px,border:2px solid #fd7b01]{S(\widetilde{x})=\frac{\sum\limits_{i=1}^n|x_i-\widetilde{x}|}{n}}$$

Lo scarto medio assoluto dalla mediana è sempre minore dallo scarto medio assoluto dalla media. Sussiste, dunque, la seguente relazione: $$S(\widetilde{x}) < S(\overline{x})$$

Calcolo degli scostamenti medi assoluti dalla media e dalla mediana

Calcoliamo entrambi gli scostamenti medi assoluti del seguente insieme di dati $$2,5,4,7,2,8,9$$

Svolgimento

Innanzitutto è necessario calcolare la media e, dopo aver ordinato i dati (2,2,4,5,7,8,9), la mediana: $$\begin{eqnarray} \overline{x}&=&\frac{2+5+4+7+2+8+9}{7}=5.29\\ \widetilde{x}&=& 5\end{eqnarray}$$

Gli scostamenti dalla media e dalla mediana sono rispettivamente: $$\begin{eqnarray} S(\overline{x}) &=& \frac{|2-5.29|+|5-5.29|+|4-5.29|+|7-5.29|+|2-5.29|+|8-5.29|+|9-5.29|}{7}=2.33\\ S(\widetilde{x}) &=& \frac{|2-5|+|5-5|+|4-5|+|7-5|+|2-5|+|8-5|+|9-5|}{7}=2.29\end{eqnarray}$$

Letto 111 volte

Effettua il LOGIN al sito per aggiungere commenti oppure REGISTRATI se non hai ancora un account.

Seguimi sui social

Accesso utenti