Webtudordimatematica
Esercizi di statistica

Esercizi sulle proprietà degli stimatori

Verificare se uno stimatore è distorto, efficiente o consistente. Calcolo distorsione ed errore quadratico medio. Quale è il miglior stimatore?

  1. Confronto stimatori mediante calcolo distorsione e MSE
Eserciziari di Matematica Generale, Analisi I e II, Statistica, Fisica e Algebra Lineare...
Siano $X_1,X_2,\dots ,X_n$ variabili aleatorie i.i.d. (identically independently distributed) di Poisson di parametro $\lambda$. Si considerino, inoltre, i seguenti stimatori: $$T_1=\sum\limits_{i=1}^n X_i\qquad T_2=\sum\limits_{i=1}^n i\cdot X_i\qquad T_3=\frac{1}{n}\sum\limits_{i=1}^n X_i$$
  1. Calcolare le distorsioni e l'errore quadratico medio di ciascun stimatore
  2. Quale dei tre stimatori sceglieresti e perchè?
  3. Quale stimatore reputi il peggiore dei tre e perchè?
Esercizio 1

a) Prima di tutto ricordiamo che valore atteso e varianza di variabili con distribuzione di Poisson di parametro $\lambda$ sono $\mu_x=\sigma_x^2=\lambda$.

Calcoliamo la distorsione dei tre stimatori ridordando la formula $D(T)=E(T)-\mbox{"Parametro da stimare"}$: $$\begin{align*} D(T_1)&=E\left(\sum\limits_{i=1}^n X_i\right)-\lambda=\\ &=E(X_1,X_2,\dots ,X_n)-\lambda=\\ &=E(X_1)+E(X_2)+\dots + E(X_n)-\lambda=\\ &=n\lambda-\lambda=\lambda(n-1)\\ D(T_2)&= E\left(\sum\limits_{i=1}^n i\cdot X_i\right)-\lambda=\\ &= E(1\cdot X_1+2\cdot X_2+\dots +n\cdot X_n)-\lambda=\\ &= 1\cdot E(X_1)+2\cdot E(X_2)+\dots + n\cdot E(X_n)-\lambda=\\ &=\lambda\underbrace{(1+2+\dots +n)}_{\color{blue}{\substack{\mbox{Somma dei primi}\\ \mbox{n termini: }{n(n+1)\over 2}}}}-\lambda=\\ &= \lambda{n(n+1)\over 2}-\lambda=\lambda\left({n^2+n-2\over 2}\right)\\ D(T_3)&=E\left({1\over n}\sum\limits_{i=1}^n X_i\right)-\lambda=\\ &={1\over n}E(X_1,X_2,\dots ,X_n)-\lambda=\\ &={1\over \cancel{n}}\cancel{n}\lambda-\lambda=\lambda-\lambda=0\end{align*}$$

Per calcolare l'errore quadratico medio è necessario calcolare prima la varianza dei 3 stimatori: $$\begin{align*} Var(T_1)&=Var\left(\sum\limits_{i=1}^n X_i\right)=\\ &=Var(X_1,X_2,\dots ,X_n)\overset{\color{blue}{X_i\mbox{ ind.}}}{=}\\ &=Var(X_1)+Var(X_2)+\dots + Var(X_n)=n\lambda\\ Var(T_2)&= Var\left(\sum\limits_{i=1}^n i\cdot X_i\right)=\\ &= Var(1\cdot X_1+2\cdot X_2+\dots +n\cdot X_n)=\\ &= 1^2\cdot Var(X_1)+2^2\cdot Var(X_2)+\dots + n^2\cdot Var(X_n)=\\ &=\lambda\underbrace{(1^2+2^2+\dots +n^2)}_{{\color{blue}{\substack{\mbox{Somma dei primi}\\ \mbox{n termini$^2$: }{n(n+1)(2n+1)\over 6}}}}}=\\ &=\lambda{n(n+1)(2n+1)\over 6}-\lambda=\lambda\left({2n^3+3n^2+n\over 6}\right)\\ Var(T_3)&=Var\left({1\over n}\sum\limits_{i=1}^n X_i\right)=\\ &={1\over n^2}Var(X_1,X_2,\dots ,X_n)=\\ &={1\over n^\cancel{2}}\cancel{n}\lambda={1\over n}\lambda\end{align*}$$

Adesso possiamo calcolare l'errore quadratico medio MSE ricordando la formula $MSE(T)=Var(T)+D(T)^2$ $$\begin{align*} MSE(T_1)&=Var(T_1)+D(T_1)^2=n\lambda+\lambda^2(n-1)^2\\ MSE(T_2)&=Var(T_2)+D(T_2)^2=\\ &=\lambda\left({2n^3+3n^2+n\over 6}\right)+\lambda^2\left({n^2+n-2\over 2}\right)^2\\ MSE(T_3)&=Var(T_3)+D(T_3)^2={1\over n}\lambda\end{align*}$$

Risulta che $$D(T_3) < D(T_1) < D(T_2)$$ e $$MSE(T_3) < MSE(T_1) < MSE(T_2)$$ Il migliore stimatore è sicuramente $T_3$ essendo la sua distorsione nulla, mentre il peggiore risulta essere $T_2$, visto che ha sia distorsione e MSE maggiore rispetto a tutti gli altri.

L'esercizio non è chiaro?

10.000 esercizi
formazione completa

Eserciziari di Matematica Generale, Analisi I e II, Statistica, Fisica e Algebra Lineare

Leggi tutto

Statistica
Video corsi

Video corso R per ricercatori e professionisti

Leggi tutto

Altri esercizi di statistica

Il quaderno degli appunti
Statistica e Probabilità

Indice di connessione di Mortara

L'indice di Mortara è un indice utilizzato per misurare il grado di connessione o associazione tra due variabili X e Y qualitative nominali o categor
Statistica e Probabilità

Indice di connessione Chi-quadrato

Il Chi-quadrato è l'indice di connessione più utilizzato in statistica per valutare l'associazione tra due variabili categoriali o qualitative. Ad
Statistica e Probabilità

Indice V di Cramer

L'indice di Cramer è un indice di connessione normalizzato usato per stabilire il grado di associazione tra due variabili qualitative nominali X eY.