Per caratterizzare in modo esauriente una distribuzione sono utili, oltre alle misure di tendenza centrale e di dispersione, anche altre misure che mettono in evidenza se una distribuzione è simmetrica rispetto a un determinato valore e se risulta più o meno appiattita.
Per tale scopo, si hanno a disposizione due misure di forma:
Prima di tutto però definiamo cos'è la simmetria di che tipo può essere.
Asimmetria destra e sinistra
Osservando la rappresentazione grafica di una distribuzione ci si rende conto facilmente se la distribuzione è simmetrica o meno: se è simmetrica esiste un punto dell'ascissa tale che, tracciando un asse verticale passante per quel punto, la curva risulta speculare rispetto a tale asse, detto asse di simmetria.
Ad esempio, le distribuzioni nella figura qui sotto, sono simmetriche: come detto qui media, moda e mediana coincidono.
Quando invece la distribuzione presenta code di lunghezza diversa (vedi qui), si parla di asimmetria positiva o destra e asimmetria negativa o sinistra.
Coefficiente di asimmetria di Fisher
Il coefficiente di asimmetria di Fisher misura il grado di asimmetria di una distribuzione ed è definito da $$\bbox[#ffffff,5px,border:2px solid #ff6600]{a=\frac{\frac{\sum_i(x_i-\overline{x})^3f_i}{\sum_if_i}}{s^3}}$$
dove
- $a$ indica l'indice di asimmetria di Fisher,
- $x_i$ sono i valori della distribuzione
- $\overline{x}$ è il valore medio
- $f_i$ sono le frequenze
- $s$ è lo scarto quadratico medio della distribuzione.
Osserviamo che se la distribuzione è simmetrica rispetto alla media, il coefficiente di asimmetria è nullo in quanto i termini della sommatoria hanno somma nulla, mentre tanto più la distribuzione è asimmetrica tanto più $a$ è grande in valore assoluto; risulta inoltre:
- $a>0$ nel caso di asimmetria destra
- $a < 0$ nel caso di asimmetria sinistra
Coefficiente di curtosi di Pearson
La curtosi è un coefficiente di forma valido per curve unimodali (con una sola moda) tendenzialmente simmetriche.
Esso misura il maggiore o minore appiattimento di una curva rispetto alla curva normale o curva di Gauss.La curtosi si misura mediante il coefficiente di curtosi di Pearson $$\bbox[#ffffff,5px,border:2px solid #ff6600]{K=\frac{\frac{\sum_i(x_i-\overline{x})^4f_i}{\sum_if_i}}{s^4}}$$
dove
- $K$ indica l'indice di curtosi,
- $x_i$ sono i valori della distribuzione
- $\overline{x}$ è il valore medio
- $f_i$ sono le frequenze
- $s$ è lo scarto quadratico medio della distribuzione.
Il valore di $K$ varia da 0 a infinito,in particolare
- $K=3$ nel caso della curva normale
- $K > 3$ nel caso di distribuzioni più appuntite della normale
- $K < 3$ nel caso di distribuzioni meno appuntite della normale