Il Teorema del Limite Centrale, abbreviato TLC, è un teorema molto importante del calcolo delle probabilità che ci consente di conoscere la distribuzione del campione selezionato anche se non sappiamo nulla sul tipo di distribuzione della popolazione da cui il campione è stato estratto.
Il Teorema del Limite Centrale afferma che sotto le stesse ipotesi della legge dei grandi numeri, ossia in presenza di $n$ campioni casuali indipendenti e identicamente distribuiti $X_i$ con media pari a $\mu_X$ e varianza $\sigma_X^2$, la variabile aleatoria $(\overline{X}-\mu_X)/\sigma_{\overline{X}}$ (dove $\sigma_{\overline{X}}^2=\sigma_X^2/n$) si può approssimare alla distribuzione normale standard.
In formule si ha:
$$\bbox[#ffffff,5px,border:2px solid #ff6600]{\frac{\overline{X}-\mu_X}{\sigma_{\overline{X}}}=\frac{\overline{X}-\mu_X}{\frac{\sigma_X}{\sqrt{n}}}\sim N(0,1)\quad\mbox{per } n\rightarrow\infty}$$
dove $\overline{X}$ è la media campionaria così definita:
$$\overline{X}=\cfrac{X_1+X_2+\dots + X_n}{n}$$
Osserviamo un'analogia con quanto detto nel paragrafo della distribuzione normale. Sappiamo, infatti, che la distribuzione di $\overline{X}$ è esattamente una distribuzione normale di parametri $\mu_X$ e $\frac{\sigma_X^2}{n}$ quando i vari $X_i$ hanno distribuzione normale di parametri $\mu_X$ e $\sigma_X^2$ cioè:
$$X_i\sim N(\mu_X,\sigma_X^2)\ \forall i\quad\Rightarrow\quad \overline{X}=\frac{X_1+X_2+\dots +X_n}{n}\sim N\left(\mu_X,\frac{\sigma_X^2}{n}\right)$$
Il teorema del limite centrale dice che questo stesso risultato è approssimativamente vero quando $n$ è "abbastanza grande" anche se $X_1,X_2,\dots ,X_n$ non sono normalmente distribuiti.
Ma cosa si intende per "abbastanza grande"? Quanto grande deve essere n affinché la distribuzione di $\overline{X}$ è approssimativamente normale? La risposta a questa domanda varia in base al tipo di distribuzione degli $X_i$. Da un lato, se tutti gli $X_i$ sono normalmente distribuiti, allora $\overline{X}$ ha esattamente distribuzione normale per ogni valore di n. Dall'altro lato, se gli $X_i$ hanno distribuzione ben diversa da quella normale, allora questa approssimazione richiede che n sia almeno pari a 30.