In questa lezione, definiamo alcuni indici numerici, chiamati indici di posizione, utili per descrivere dati numerici e la loro distribuzione di frequenza. Alcuni di loro, vengono utilizzati anche nella statistica inferenziale per la determinazione degli intervalli di confidenza e per verifica di ipotesi.
Gli indici di tendenza centrale sono:
Media, mediana e moda sono detti indici di posizione o indici di tendenza centrale, perché descrivono attorno a quale valore è centrato l'insieme dei dati.
Confronto tra media, moda e mediana
La moda viene usata per lo più quando si trattano dati di tipo qualitativo, per i quali non è possibile calcolare media e mediana; essa è poco utilizzata soprattutto se i dati sono tanti e tutti diversi tra loro: in tal caso, infatti, la moda può non esistere o essere lontana dal centro dell'insieme dei dati.
La mediana è preferibile alla media quando si vogliono eliminare gli effetti di valori estremi molto diversi dal resto dei dati dell'insieme: questo perché la mediana non utilizza tutti i dati, ma solo il dato centrale o i due dati centrali.
Tuttavia, il fatto che la mediana utilizza solo i dati centrali, la rende poco sensibile a tutti gli altri valori dell'insieme e per tale motivo il suo uso è limitato.
Relazione tra media, moda e mediana
- Per distribuzioni unimodali simmetriche (ad esempio distribuzione normale) la media aritmetica, la mediana e la moda coincidono.
- Per distribuzioni asimmetriche a destra (o con asimmetria positiva) si ha $\overline{x} > Me > \widetilde{x}$
- Per distribuzioni asimmetriche a sinistra (o con asimmetria negativa) si ha $\widetilde{x} > Me > \overline{x}$