Un importante metodo utilizzato nella statistica inferenziale per trarre informazioni sull'intera popolazione estraendo casualmente dei campioni, è la stima dei parametri. Nello specifico, si effettua una stima dei parametri di una popolazione, media, varianza, scarto quadratico medio per mezzo dei corrispondenti parametri campionari o statistiche del campione.
Poiché il valore del parametro da stimare per la popolazione è incognito, possiamo solo verificare, dopo ripetuti campionamenti, se la distribuzione della statistica possiede certe proprietà che garantiscono una buona approssimazione della stessa al valore incognito del parametro.
Ad esempio, abbiamo visto che la media campionaria ha la stessa media della popolazione. Ci si aspetta, quindi, che dopo diversi campionamenti, la media campionaria sia circa uguale alla media della popolazione.
Per i parametri della popolazione è possibile calcolare due tipi di stima:
si chiama stima puntuale di un parametro della popolazione, la stima data da un singolo valore;
si chiama stima per intervallo di un parametro della popolazione, la stima data da un intervallo all'interno del quale si può supporre, con un certo grado di fiducia, che si trovi il parametro.
I parametri che vengono spesso stimati sono:
- la media $\mu$ della popolazione;
- la varianza $\sigma^2$ della popolazione;
- la proporzione $p$ di una popolazione con determinate proprietà;
- la differenza fra le medie di due popolazioni $\mu_1-\mu_2$;
- la differenza fra le proporzioni di due popolazioni $p_1-p_2$.
Stime puntuali per i parametri della popolazione
Si individuano, in maniera ragionevole, le seguenti stime per i parametri sopra elencati:
- per $\mu$ la media campionaria $\overline{x}$;
- per $\sigma^2$ la varianza campionaria $s^2$;
- per $p$ la proporzione campionaria $\hat{p}=\frac{x}{n}$ dove $x$ è il numero di elementi estratti da un campione di ampiezza $n$ aventi una determinata caratteristica;
- per $\mu_1-\mu_2$ la differenza $\overline{x}_1-\overline{x}_2$ fra le medie di due campioni indipendenti;
- per $p_1-p_2$ la differenza $\hat{p}_1-\hat{p}_2$ fra le proporzioni di due campioni indipendenti.
Precisiamo che, si possono avere diverse stime puntuali per uno stesso parametro. Ad esempio, la media della popolazione potrebbe essere stimata anche usando la mediana campionaria oppure la media tra il più piccolo e il più grande valore estratti da un campione.
La statistica che si usa per stimare un parametro della popolazione è detto stimatore del parametro.
Diciamo, per esempio, che la media campionaria e la mediana sono stimatori della media della popolazione.
Forse sei interessato anche alle proprietà degli stimatori?