Sia $X$ una variabile aleatoria con media $E(X)=\mu$ e varianza $VAR(X)=\sigma^2$ e sia $X_1,X_2,\dots ,X_n$ un campione casuale.
Si definisce varianza campionaria la quantità:
$$\bbox[#ffffff,5px,border:2px solid #ff6600]{S^2=\frac{1}{n-1}\sum\limits_{i=1}^n\left(X_i-\overline{X}\right)^2}$$
La deviazione standard campionaria è la radice quadrata della varianza campionaria:
$$S=\sqrt{S^2}$$
Osserviamo che, la formula della varianza campionaria e molto simile a quella della varianza della popolazione. La varianza della popolazione $E\left[(X-\mu)^2\right]$ è il valore medio di $(X-\mu)^2$. Analogamente, la varianza campionaria è la media campionaria di $(X_i-\mu)^2,\ i=1,\dots ,n$ a meno delle seguenti 2 modifiche:
- $\mu$ viene sostituito da $\overline{X}$;
- nel calcolo della media viene usato il divisore $n-1$ invece di $n$.
La prima modifica è dovuta al fatto che $\mu$ è sconosciuto e deve essere quindi stimato; lo stimatore naturale di $\mu$ è $\overline{X}$. La seconda modifica, invece, è spiegata dal fatto che, stimando $\mu$ con $\overline{X}$, viene introdotta una piccola distorsione in $(X_i-\overline{X})^2$. Infatti,
$$E\left[(X_i-\overline{X})^2\right]=\frac{n-1}{n}\sigma^2$$
da cui
$$E\left[\sum\limits_{i=1}^n(Y_i-\overline{Y})^2\right]=nE\left[(X_i-\overline{X})^2\right]=(n-1)\sigma^2$$
Da quest'ultima, si capisce come, dividendo per $n-1$ nella formula della varianza campionaria, viene corretta la piccola distorsione e perciò $S^2$ è uno stimatore non distorto
Dividendo per n-1 nella formula della varianza campionaria abbiamo corretto i gradi di libertà: la stima della media causa la perdità di 1 grado di libertà nei dati, cosicchè, ne rimangono solo n-1.
Sia data una popolazione normale avente varianza $\sigma^2$ e da essa si estraggono campioni casuali di ampiezza $n$; allora, la variabile
$$\bbox[#ffffff,5px,border:2px solid #ff6600]{\chi ^2=\frac{(n-1)S^2}{\sigma^2}}$$
è una variabile aleatoria avente distribuzione $\chi ^2$ (chi quadro o chi quadrato) con $\nu=n-1$ gradi di libertà.
Come la distribuzione t di Student, anche la distribuzione chi quadro non è un'unica distribuzione, ma una famiglia di distribuzioni dipendenti dal grado di libertà $\nu$.
Si dimostra che la distribuzione $\chi ^2$ ha media $\mu=\nu$ e varianza $\sigma^2=2\nu$.
Nella figura sottostante sono riportati i grafici della distribuzione $\chi^2$ per valori di $\nu$ da 1 a 5
E' possibile ricavare i valori di probabilità corrispondenti ai valori critici della curva consultando la tavola statistica della distribuzione chi quadro.
Errore standard della media campionaria $\overline{X}$
Ricordiamo che la deviazione standard della distribuzione campionaria di $\overline{X}$ è $\sigma_{\overline{X}}=\frac{\sigma}{\sqrt{n}}$ (vedi qui). Si vede che un suo stimatore è
$$SE(\overline{X})=\frac{S}{\sqrt{n}}$$
ed è chiamato errore standard di $\overline{X}$.
Se $X_1,\dots ,X_n$ sono variabili Bernoulliane identicamente distribuite, con probabilità di successo $p$. Inoltre, poichè:
$$VAR(\overline{X})=\frac{p(1-p)}{n}$$
si ha:
$$SE(\overline{X})=\sqrt{\frac{\overline{X}(1-\overline{X})}{n}}$$
Forse ti interessa pure la distribuzione della varianza campionaria.