In questa lezione vedremo faremo inferenza sul coefficiente angolare della retta di regressione e in particolare ti insegnerò a
- calcolare un intervallo di confidenza per il coefficiente angolare $\beta_1$;
- eseguire un test di ipotesi su $\beta_1$ per verificarne la sua significatività all'interno del modello.
Se vuoi ripassare la regressione lineare semplice vai in questo articolo.
Iniziamo dal punto 1). Fissato un livello di confidenza $(1-\alpha)100%$ e indicato con
- $n$ la numerosità del campione,
- $s_{b_1}$ l'errore standard del coefficiente $b_1$
- $t_{\frac{\alpha}{2},n-2}$ valore critico della distribuzione T di student corrispondente alla probabilità $\frac{\alpha}{2}$ e con $n-2$ gradi di libertà,
gli estremi dell'intervallo di confidenza per $\beta_1$ si calcolano mediante la formula: $$\bbox[#ffffff,5px,border:2px solid #ff6600]{b_1\pm t_{\frac{\alpha}{2},n-2}\cdot s_{b_1}}\qquad \large(\large\star)$$
Risulta importante osservare che se il valore dell'errore standard $s_{b_1}$ non è noto, possiamo ricavarlo dalla seguente formula: $$\bbox[#ffffff,5px,border:2px solid #ff6600]{s_{b_1}^2=\frac{s_e^2}{(n-1)s_x^2}}$$ dove $s_e^2$ è la varianza dell'errore del modello o varianza della popolazione o ancora varianza residua (approfondisci qui) ed è data da: $$\bbox[#ffffff,5px,border:2px solid #ff6600]{s_e^2=VAR_{residua}=\frac{SSE}{n-2}=\frac{SST-SSR}{n-2}= \frac{(n-1)s_y^2-b_1^2(n-1)s_x^2}{n-2}}$$
Analizziamo il punto 2). In base all'ipotesi alternativa che bisogna introdurre nel sistema di ipotesi, si possono avere tre diversi tipi di test:
- Unilaterale sinistro: $$\begin{cases} H_0:\beta_1=0\\ H_1:\beta_1 < 0\end{cases}$$
- Unilaterale destro: $$\begin{cases} H_0:\beta_1=0\\ H_1:\beta_1 > 0\end{cases}$$
- Bilaterale o a due code: $$\begin{cases} H_0:\beta_1=0\\ H_1:\beta_1\neq 0\end{cases}$$
In tutti e tre i casi la statistica test da calcolare è: $$\bbox[#ffffff,5px,border:2px solid #ff6600]{T=\frac{b_1}{s_{b_1}}}\qquad \large(\large\star\large\star)$$
Inoltre, nel caso di test unilaterale (sinistro o destro) il valore critico con cui confrontare il valore della statistica test $(\large\star\large\star)$ sarà $t_{\alpha}(n-2)$; mentre nel caso di test bilaterale invece avremo $t_{\frac{\alpha}{2}}(n-2)$.
L'esito del test a seconda il tipo di test sarà:
- Unilaterale sinistro:
Rifiuto $H_0$ se $T < t_{\alpha}(n-2)$ - Unilaterale destro:
Rifiuto $H_0$ se $T > t_{\alpha}(n-2)$ - Bilaterale:
Rifiuto $H_0$ se $|T| > t_{\frac{\alpha}{2}}(n-2)$
Esempio
Dato il modello di regressione semplice $Y=\beta_0+\beta_1X$, verificate l'ipotesi nulla che $\beta_1$ sia $0$ contro l'alternativa che sia positivo, usando una probabilità di errore di primo tipo $\alpha=0.05$. Determinare inoltre l'intervallo di confidenza a livello $95%$. Campione casuale di ampiezza $n=29$, con $b_1=6.7$ e $s_{b_1}=3$.Dal testo si evince chiaramente che il test di ipotesi è unilaterale destro: $$\begin{cases} H_0:\beta_1=0\\ H_1:\beta_1 > 0\end{cases}$$
Per la $(\large\star\large\star)$ la statistica test risulta: $$T=\frac{6.7}{3}=2.23$$ e il valore critico ricavato dalle tavole della T di Student è $t_{0.05}(27)=1.70$.
Poichè $T=2.23 > t_{0.05}(27)=1.70$, si rifiuta $H_0$.
Passiamo all'intervallo di confidenza.
Dalle tavole della distribuzione T di Student abbiamo che $t_{\frac{\alpha}{2}}(n-2)=t_{0.05}(27)=2.05$. Quindi, applicando la $(\large\star)$ otteniamo: $$6.7\pm 2.05\cdot 3\begin{array}{l} \nearrow\\ \searrow\end{array} \begin{array}{l} 6.7- 2.05\cdot 3=0.55\\ \\ 6.7+ 2.05\cdot 3=12.85\end{array}$$