L'indice di Cramer è un indice di connessione normalizzato usato per stabilire il grado di associazione tra due variabili qualitative nominali X eY. Tale indice si basa sul test del chi-quadrato per il quale ho dedicato una lezione specifica (clicca sul link).
La V di Cramer per una tabella di contigenza con r righe e c colonne si calcola mediante la seguente formula:
$$\bbox[#ffffff,5px,border:2px solid #ff6600]{V=\sqrt{\cfrac{\chi^2/n}{min[(r-1),(c-1)]}}}$$
dove n è il totale delle frequenze è $\chi^2$ è il valore del chi-quadrato. Se non ti ricordi come calcolarlo vai qui: procedura di calcolo del chi-quadrato.
Proprietà dell'indice V di Cramer
L'indice V di Cramer, essendo un indice di connessione normalizzato, gode delle seguenti proprietà:
- varia tra 0 e 1 e in particolare: 0 rappresenta il caso limite di totale indipendenza (connessione nulla tra X e Y), mentre 1 corrisponde al caso limite di massima dipendenza (o massima connessione tra X e Y).
- Dalla prima proprietà segue che valori dell'indice di Cramer che sono vicini a zero indicano scarsa connessione tra X e Y, mentre invece valori dell'indice che si allontanano da zero indicano la presenza di connessione tra i due caratteri.
- È la radice quadrata dell'indice Chi-quadrato normalizzato.