Webtudordimatematica

Inferenza sul coefficiente angolare

Nel precedente articolo, abbiamo visto come stimare un modello di regressione lineare semplice $Y=\beta_0+\beta_1X$ calcolando i parametri $b_0$ e $b_1$ (stimatori rispettivamente di $\beta_0$ e $\beta_1$) della retta di regressione (o modello stimato) $\hat{Y}=b_0+b_1\hat{X}$.

In questo articolo vedremo come

  1. calcolare un intervallo di confidenza per il coefficiente angolare $\beta_1$;
  2. eseguire un test di ipotesi su $\beta_1$ per verificarne la sua significatività all'interno del modello.

Per far ciò, ci limiteremo alla presentazione delle formule necessarie per risolvere gli esercizi senza imbatterci in lunghe e complesse dimostrazioni delle stesse.

Iniziamo dal punto 1). Fissato un livello di confidenza $(1-\alpha)100%$ e indicato con

  • $n$ la numerosità del campione,
  • $s_{b_1}$ l'errore standard del coefficiente $b_1$
  • $t_{\frac{\alpha}{2},n-2}$ valore critico della distribuzione T di student corrispondente alla probabilità $\frac{\alpha}{2}$ e con $n-2$ gradi di libertà,

gli estremi dell'intervallo di confidenza per $\beta_1$ si calcolano mediante la formula: $$\bbox[#ffffff,5px,border:2px solid #ff6600]{b_1\pm t_{\frac{\alpha}{2},n-2}\cdot s_{b_1}}\qquad \large(\large\star)$$

Risulta importante osservare che se il valore dell'errore standard $s_{b_1}$ non è noto, possiamo ricavarlo dalla seguente formula: $$\bbox[#ffffff,5px,border:2px solid #ff6600]{s_{b_1}^2=\frac{s_e^2}{(n-1)s_x^2}}$$ dove $s_e^2$ è la varianza dell'errore del modello o varianza della popolazione o ancora varianza residua (approfondisci qui) ed è data da: $$\bbox[#ffffff,5px,border:2px solid #ff6600]{s_e^2=VAR_{residua}=\frac{SSE}{n-2}=\frac{SST-SSR}{n-2}= \frac{(n-1)s_y^2-b_1^2(n-1)s_x^2}{n-2}}$$

Analizziamo il punto 2). In base all'ipotesi alternativa che bisogna introdurre nel sistema di ipotesi, si possono avere tre diversi tipi di test:

  • Unilaterale sinistro: $$\begin{cases} H_0:\beta_1=0\\ H_1:\beta_1 < 0\end{cases}$$
  • Unilaterale destro: $$\begin{cases} H_0:\beta_1=0\\ H_1:\beta_1 > 0\end{cases}$$
  • Bilaterale o a due code: $$\begin{cases} H_0:\beta_1=0\\ H_1:\beta_1\neq 0\end{cases}$$

In tutti e tre i casi la statistica test da calcolare è: $$\bbox[#ffffff,5px,border:2px solid #ff6600]{T=\frac{b_1}{s_{b_1}}}\qquad \large(\large\star\large\star)$$

Inoltre, nel caso di test unilaterale (sinistro o destro) il valore critico con cui confrontare il valore della statistica test $(\large\star\large\star)$ sarà $t_{\alpha}(n-2)$; mentre nel caso di test bilaterale invece avremo $t_{\frac{\alpha}{2}}(n-2)$.

L'esito del test a seconda il tipo di test sarà:

  • Unilaterale sinistro:
    Rifiuto $H_0$ se $T < t_{\alpha}(n-2)$
  • Unilaterale destro:
    Rifiuto $H_0$ se $T > t_{\alpha}(n-2)$
  • Bilaterale:
    Rifiuto $H_0$ se $|T| > t_{\frac{\alpha}{2}}(n-2)$

Esempio

Dato il modello di regressione semplice $Y=\beta_0+\beta_1X$, verificate l'ipotesi nulla che $\beta_1$ sia $0$ contro l'alternativa che sia positivo, usando una probabilità di errore di primo tipo $\alpha=0.05$. Determinare inoltre l'intervallo di confidenza a livello $95%$. Campione casuale di ampiezza $n=29$, con $b_1=6.7$ e $s_{b_1}=3$.

Dal testo si evince chiaramente che il test di ipotesi è unilaterale destro: $$\begin{cases} H_0:\beta_1=0\\ H_1:\beta_1 > 0\end{cases}$$

Per la $(\large\star\large\star)$ la statistica test risulta: $$T=\frac{6.7}{3}=2.23$$ e il valore critico ricavato dalle tavole della T di Student è $t_{0.05}(27)=1.70$.

Poichè $T=2.23 > t_{0.05}(27)=1.70$, si rifiuta $H_0$.

Passiamo all'intervallo di confidenza.

Dalle tavole della distribuzione T di Student abbiamo che $t_{\frac{\alpha}{2}}(n-2)=t_{0.05}(27)=2.05$. Quindi, applicando la $(\large\star)$ otteniamo: $$6.7\pm 2.05\cdot 3\begin{array}{l} \nearrow\\ \searrow\end{array} \begin{array}{l} 6.7- 2.05\cdot 3=0.55\\ \\ 6.7+ 2.05\cdot 3=12.85\end{array}$$

Il quaderno degli appunti
Statistica e Probabilità

Coefficiente di correlazione di Pearson

Dati due variabili quantitative X e Y, si dice coefficiente di correlazione lineare o covarianza normalizzata di X e Y il rapporto tra la covarianza e
Trigonometria

Teorema del coseno o di Carnot

Il teorema del coseno (o di Carnot) è una conseguenza del teorema delle proiezioni (visto qui) e afferma che in un triangolo qualsiasi, il quadrato d
Trigonometria

Teorema delle proiezioni

Il teorema delle proiezioni dice che in un triangolo qualsiasi la misura di un lato è uguale alla somma dei prodotti di quelle degli altri due lati p