Oltre alla mediana, che divide a metà un insieme di dati ordinati, nell'ambito della statistica descrittiva vengono usati anche altri indici di posizione detti quantili, i quali dividono le distribuzioni in determinate percentuali. Questi sono detti indici di posizione non centrale o di non centralità e vengono usati soprattutto per ampi insiemi di dati.
A seconda delle percentuali in cui la distribuzione viene suddivisa, si classificano diversi tipi di quantili:
- Mediana (quantile di ordine 1/2);
- Quartili (quantili di ordine 1/4, 1/2 e 3/4);
- Decili (quantili di ordine 1/10);
- Centili o percentili (quantili di ordine 1/100).
Cerchi esercizi svolti sul calcolo dei quartili o più in generale dei quantili? Clicca sul bottone qui sotto!
Riguardo alla mediana ti ho scritto un articolo dedicato (clicca qui). Di seguito invece ti parlo in dettaglio degli altri quantili.
Quartili
I quartili, come dice la parola stessa, si ottengono dividendo l'insieme di dati ordinati in 4 parti uguali ed esattamente:
- il primo quartile $Q_1$ è il valore che lascia alla sua sinistra il 25% degli elementi della distribuzione; $Q1$ è anche detto 25-esimo percentile ($P_{0.25}$).
- Il secondo quartile $Q_2$ coincide con la mediana dato che è quello che lascia alla sua sinistra il 50% dei dati della distribuzione; $Q2$ è anche detto 50-esimo percentile ($P_{0.5}$).
- Il terzo quartile $Q_3$ è il valore che lascia il 75% degli elementi a sinistra e il 25% a destra; $Q3$ è anche detto 75-esimo percentile ($P_{0.75}$).
Ecco la rappresentazione grafica dei quartili di una distribuzione:
Tuttavia, in statistica, il grafico che si preferisce scegliere per rappresentare i quartili è il boxplot. Te ne ho parlato in dettaglio in questa lezione.
Percentili
I percentili, invece, dividono la distribuzione in 100 parti, ad esempio:
- il 1° percentile $P_{0.01}$ lascia alla sua sinistra un centesimo degli elementi della distribuzione, ossia l'1%;
- il 10° percentile $P_{0.1}$ lascia alla sua sinistra il 10% degli elementi della distribuzione;
- il 50° percentile (che coincide con la mediana e con il secondo quartile) lascia alla sua sinistra il 50% della distribuzione.
Decili
I decili, invece, dividono la distribuzione in 10 parti, ad esempio:
- il primo decile $P_{0.1}$ lascia alla sua sinistra un decimo degli elementi della distribuzione, ossia il 10%;
- il terzo decile $P_{0.3}$ lascia alla sua sinistra il 30% degli elementi della distribuzione;
- il quinto decile (che coincide con la mediana e con il secondo quartile) lascia alla sua sinistra il 50% della distribuzione.
Regola pratica per il calcolo dei quartili e dei percentili
Per calcolare i quartili (o anche i percentili) di una distribuzione, seguiamo i passi di seguito indicati:
- Si ordinano gli $n$ dati della distribuzione in ordine crescente;
- Indicato con $p$ il percentile in decimale ($p=0.25$ per il 25° percentile o 1° quartile, $p=0.37$ per il 37° percentile), si calcola il prodotto $k=np$;
- se $k$ è un intero, il quartile (percentile) si ottiene facendo la media del $k$-esimo e del $(k+1)$-esimo valore dei dati ordinati;
- se $k$ non è un intero, si arrotonda $k$ per eccesso al primo intero successivo e si sceglie come quartile (percentile) il corrispondente valore dei dati ordinati
Esempio calcolo quartili
Calcolare il primo e il terzo quartile dell'insieme di dati $$32.2\quad 32\quad 30.4\quad 31\quad 31.2\quad 31.3\quad 30.3\quad 29.6\quad 30.5\quad 30.7$$
Ordiniamo i dati: $$29.6\quad 30.3\quad 30.4\quad 30.5\quad 30.7\quad 31\quad 31.2\quad 31.3\quad 32\quad 32.2$$
Per il primo quartile abbiamo: $$n=10,\quad p=0.25,\quad k=np=2.5$$
Poichè $k$ non è intero, si arrotonda per eccesso ($k=3$): il primo quartile è il terzo dei dati ordinati, ovvero, $$Q_1=30.4$$
Per il secondo quartile, ovvero la mediana, abbiamo: $$n=10,\quad p=0.5,\quad k=np=5$$
Poichè $k$ è intero, si fa la media tra il quinto e il sesto dato ottenendo $$Q_2=\frac{30.7+31}{2}=30.85$$
Per il terzo quartile abbiamo: $$n=10,\quad p=0.75,\quad k=np=7.5$$
Poichè $k$ non è intero, si arrotonda per eccesso ($k=8$): il terzo quartile è l'ottavo dei dati ordinati, ovvero, $$Q_3=31.3$$
Esempio calcolo percentili
Calcolare il 95-esimo percentile per i dati (già ordinati) della seguente tabella
Seguendo lo stesso procedimento adottato per calcolare i quartili otteniamo: $$n=80,\quad p=0.95,\quad k=np=76$$
Essendo $k$ intero, si fa la media tra il 76-esimo e il 77-esimo dato. Risulta: $$P_{0.95}=\frac{27.5+28.5}{2}=28$$
Il 95-esimo percentile fornisce un'importante informazione: soltanto il 5% dei dati sono maggiori di 28.
Calcolo quartili e percentili nel caso di dati raggruppati
La formula già vista qui per il calcolo della mediana nel caso di dati raggruppati in classi, si può adattare per il calcolo di qualsiasi quartile o percentile. Ad esempio, supponiamo di voler calcolare il primo quartile e il 79-esimo percentile; una volta determinata la classe di appartenenza (vedi procedura nel caso della mediana), le formule da utilizzare sono rispettivamente: $$Q_1 = x_{i-1}+(x_i-x_{i-1})\frac{0.25-f_c^{i-1}}{f_c^i-f_c^{i-1}}$$ e $$P_{0.79} = x_{i-1}+(x_i-x_{i-1})\frac{0.79-f_c^{i-1}}{f_c^i-f_c^{i-1}}$$