Webtudordimatematica

Distribuzione chi quadro e varianza campionaria

Eserciziari di Matematica Generale, Analisi I e II, Statistica, Fisica e Algebra Lineare...

Sia $X$ una variabile aleatoria con media $E(X)=\mu$ e varianza $VAR(X)=\sigma^2$ e sia $X_1,X_2,\dots ,X_n$ un campione casuale.

Si definisce varianza campionaria la quantità:

$$\bbox[#ffffff,5px,border:2px solid #ff6600]{S^2=\frac{1}{n-1}\sum\limits_{i=1}^n\left(X_i-\overline{X}\right)^2}$$

La deviazione standard campionaria è la radice quadrata della varianza campionaria:

$$S=\sqrt{S^2}$$

Osserviamo che, la formula della varianza campionaria e molto simile a quella della varianza della popolazione. La varianza della popolazione $E\left[(X-\mu)^2\right]$ è il valore medio di $(X-\mu)^2$. Analogamente, la varianza campionaria è la media campionaria di $(X_i-\mu)^2,\ i=1,\dots ,n$ a meno delle seguenti 2 modifiche:

  1. $\mu$ viene sostituito da $\overline{X}$;
  2. nel calcolo della media viene usato il divisore $n-1$ invece di $n$.

La prima modifica è dovuta al fatto che $\mu$ è sconosciuto e deve essere quindi stimato; lo stimatore naturale di $\mu$ è $\overline{X}$. La seconda modifica, invece, è spiegata dal fatto che, stimando $\mu$ con $\overline{X}$, viene introdotta una piccola distorsione in $(X_i-\overline{X})^2$. Infatti,

$$E\left[(X_i-\overline{X})^2\right]=\frac{n-1}{n}\sigma^2$$

da cui

$$E\left[\sum\limits_{i=1}^n(Y_i-\overline{Y})^2\right]=nE\left[(X_i-\overline{X})^2\right]=(n-1)\sigma^2$$

Da quest'ultima, si capisce come, dividendo per $n-1$ nella formula della varianza campionaria, viene corretta la piccola distorsione e perciò $S^2$ è uno stimatore non distorto

Dividendo per n-1 nella formula della varianza campionaria abbiamo corretto i gradi di libertà: la stima della media causa la perdità di 1 grado di libertà nei dati, cosicchè, ne rimangono solo n-1.

Vale il seguente teorema.

Sia data una popolazione normale avente varianza $\sigma^2$ e da essa si estraggono campioni casuali di ampiezza $n$; allora, la variabile

$$\bbox[#ffffff,5px,border:2px solid #ff6600]{\chi ^2=\frac{(n-1)S^2}{\sigma^2}}$$

è una variabile aleatoria avente distribuzione $\chi ^2$ (chi quadro o chi quadrato) con $\nu=n-1$ gradi di libertà.

Come la distribuzione t di Student, anche la distribuzione chi quadro non è un'unica distribuzione, ma una famiglia di distribuzioni dipendenti dal grado di libertà $\nu$.

Si dimostra che la distribuzione $\chi ^2$ ha media $\mu=\nu$ e varianza $\sigma^2=2\nu$.

Nella figura sottostante sono riportati i grafici della distribuzione $\chi^2$ per valori di $\nu$ da 1 a 5

Funzione di densita chi quadro

E' possibile ricavare i valori di probabilità corrispondenti ai valori critici della curva consultando la tavola statistica della distribuzione chi quadro.

 

Errore standard della media campionaria $\overline{X}$

Ricordiamo che la deviazione standard della distribuzione campionaria di $\overline{X}$ è $\sigma_{\overline{X}}=\frac{\sigma}{\sqrt{n}}$ (vedi qui). Si vede che un suo stimatore è

$$SE(\overline{X})=\frac{S}{\sqrt{n}}$$

ed è chiamato errore standard di $\overline{X}$.

Se $X_1,\dots ,X_n$ sono variabili Bernoulliane identicamente distribuite, con probabilità di successo $p$. Inoltre, poichè:

$$VAR(\overline{X})=\frac{p(1-p)}{n}$$

si ha:

$$SE(\overline{X})=\sqrt{\frac{\overline{X}(1-\overline{X})}{n}}$$

Forse ti interessa pure la distribuzione della varianza campionaria.

10.000 esercizi
formazione completa

Eserciziari di Matematica Generale, Analisi I e II, Statistica, Fisica e Algebra Lineare

Leggi tutto

Statistica
Video corsi

Video corso R per ricercatori e professionisti

Leggi tutto
Il quaderno degli appunti
Statistica e Probabilità

Indice di connessione di Mortara

L'indice di Mortara è un indice utilizzato per misurare il grado di connessione o associazione tra due variabili X e Y qualitative nominali o categor
Statistica e Probabilità

Indice di connessione Chi-quadrato

Il Chi-quadrato è l'indice di connessione più utilizzato in statistica per valutare l'associazione tra due variabili categoriali o qualitative. Ad
Statistica e Probabilità

Indice V di Cramer

L'indice di Cramer è un indice di connessione normalizzato usato per stabilire il grado di associazione tra due variabili qualitative nominali X eY.