In statistica, una distribuzione di frequenza o tabella di frequenza è una tabella che contiene le modalità e le rispettive frequenze di una distribuzione $X$. La distribuzione di frequenza rappresenta un modo molto comodo e chiaro per rappresentare i valori assunti da una variabile causale $X$ soprattutto nel caso in cui tali valori siano numerosi.
La tabella di frequenza può essere costruita sia a partire da variabili qualitative che quantitative discrete e continue. Ti ho parlato in dettaglio delle tipologie di variabili aleatorie in questo articolo. Di seguito invece ti mostro degli esempi di distribuzione di frequenza per ogni tipologia di dato.
Distribuzione di frequenza per variabili quantitative discrete
Immagina di aver fatto un'indagine sul numero di ordini online fatti da 407 famiglie durante l'ultimo Black Friday. Questo vuol dire che hai raccolto 407 valori che però sono semplicemente elencati come segue:
In casi come questi, diventa necessario organizzare i dati in una tabella con due colonne: nella prima colonna mettiamo i possibili valori che assume la variabile casuale discreta $X$ (numero ordini), mentre nella seconda colonna ci vanno il numero di occorrenze per ciascun valore di $X$. Nota che il numero di ordini e quindi i valori che può assumere $X$ sono 0,1,2,3,4, mentre il numero di occorrenze, ossia le frequenze, le ottengo contando il numero di volte che compare 0, il numero di volte che compare 1, il numero di volte che compare 2, ecc. Nella maggior parte dei casi questo lavoro si può fare più semplicemente con l'utilizzo di un software come Excel o R. La tabella di frequenza che viene è cosi' fatta:
Come si legge la tabella? Semplice! Durante il Black Friday 78 famiglie hanno fatto 0 ordini, 87 famiglie hanno fatto un solo ordine, 68 famiglie ne hanno fatti 2, ecc...
Distribuzione di frequenza per variabili quantitative continue
Prendiamo adesso in esame una variabile continua come il fatturato mensile di 100 aziende. Supponiamo inoltre che tali fatturati siano espressi in migliaia di euro e che sia stati raggruppati in classi. Allora, la tabella di frequenza è di questo tipo:
Questa si chiama distribuzione di frequenza di dati raggruppati in classi. Nota che stavolta le modalità non sono singoli valori ma classi o intervalli di valori. Come si legge la tabella? 30 aziende hanno un fatturato mensile compreso tra 0 e 10 mila euro; 15 aziende hanno un fatturato mensile compreso tra 10 mila e 20 mila euro e cosi' via.
Distribuzione di frequenza per variabili qualitative
Ci sono casi in cui i dati rilevati da un'indagine statistica non sono numerici ma categoriali. Ad esempio, immagina di rilevare il colore degli occhi in una popolazione. In questo caso la variabile cole degli occhi assume le modalità marroni, azzurri, neri e verdi e ciascuna di queste compare con una certa frequenza come mostra la tabella qui sotto:
Avendo una distribuzione di frequenza posso calcolare agevolmente le statistiche descrittive come gli indici di posizione (media, mediana, quartili, ecc.) e di dispersione (varianza, scarto quadratico medio, coefficiente di variazione, ecc.). Clicca sul bottone qui in basso se vuoi vedere degli esempi numerici.