Il coefficiente di variazione è un indice di dispersione relativo che permette di confrontare la variabilità di due o più variabili nei casi in cui siano espresse mediante unità di misura o scala di misura differenti.
Per calcolare il coefficiente di variazione basta fare il rapporto tra deviazione standard e valore medio in valore assoluto. In formule: $$\bbox[#ffffff,5px,border:2px solid #fd7b01]{CV=\cfrac{\sigma}{|\overline{x}|}}$$
In genere, per evitare troppe cifre decimali il coefficiente di variazione viene espresso in forma percentuale: $$CV=\cfrac{\sigma}{|\overline{x}|}\cdot 100$$
Il coefficiente di variazione, non può essere usato quando la media della distribuzione è prossima a zero, in quanto assume valore infiniti (divisione per zero); inoltre quando la media è negativa esso assume valori negativi.
Quando la media è positiva il coefficiente di variazione può assumere valori che vanno da zero a un massimo non definito; tali valori saranno tanto minori quanto meno i dati della distribuzione sono dispersi attorno alla media.
Il direttore operativo di un'azienda di consegna pacchi sta pensando all'acquisto di un nuovo parco di autocarri. Quando i pacchi sono depositati negli autocarri in attesa della consegna si deve tenere conto di 2 vincoli principali: il peso (in chilogrammi) e il volume (in metri cubi) di ciascun pacco. Si considera un campione di 200 pacchi per cui si osserva un peso medio di 9kg, con uno scarto quadratico medio di 1,5kg e un volume medio di $2,7m^3$, con uno scarto quadratico medio di$ 0,6m^3$. Come è possibile confrontare la variabilità del peso e del volume?
Data la diversa unità di misura, per confrontare la variabilità delle due grandezze calcoloiamo il coefficiente di variazione del peso e del volume: $$\begin{array}{l}CV_{p}=\cfrac{1,5}{9}=0,17\rightarrow 17\%\\CV_{v}=\cfrac{0,6}{2,7}=0,22\rightarrow 22\% \end{array}$$
Risulta chiaramente che il volume dei pacchi ha una variabilità maggiore rispetto al peso.
Coefficiente di variazione in R
Qual è il comando R per calcolare il coefficiente di variazione? Ci sono due modi. Il primo è quello di utilizzare i comandi base di R:
cv <- sd(variabile)/abs(mean(variabile))
dove sd è il comando per calcolare la deviazione standard mentre mean serve per calcolare la media. Infine abs calcola il valore assoluto.
L'altro modo consiste nell'utilizzare il comando var.coeff contenuto nella library ineq:
library(ineq)
cv <- var.coeff(variabile)