Webtudordimatematica

CDF e classificazione delle V.A.

Eserciziari di Matematica Generale, Analisi I e II, Statistica, Fisica e Algebra Lineare...

Sia X una variabile aleatoria

La funzione $$\bbox[#ffffff,5px,border:2px solid #ff6600]{F_X(x)=P(X\leq x)\quad\quad\forall x\in\mathbb{R}}$$ è detta funzione di distribuzione o di ripartizione cumulativa (CDF) della variabile aleatoria X.

Proprietà della CDF

  • $\frac{d(F_X(x))}{dx}\geq 0\quad\forall x$, ossia la CDF è una funzione non decrescente.
  • $F_X(+\infty)=\lim\limits_{x\rightarrow +\infty}F_X(x)=1$
  • $\begin{array}{l} F_X(-\infty)=\lim\limits_{x\rightarrow -\infty}F_X(x)=0\quad\mbox{se $X$ è una V.A. continua}\\ F_X(x)(-\infty)=\lim\limits_{x\rightarrow -\infty}F_X(x)\neq 0\quad\mbox{se $X$ è una V.A. non continua}\end{array}$

Dalle precedenti proprietà si possono dedurre le seguenti:

  • $0\leq F_X(x)\leq 1\quad\forall x$.
  • $P(X>x)=1-F_X(x)\quad\forall x$.
  • $P(x_1\leq X\leq x_2)=F_X(x_2)-F_X(x_1)\quad\forall\ x1\leq x2$.
  • $P(X=x)=0\quad\forall x$ se X è continua.

Inoltre, la mediana di $X$ è il minimo valore $x_m$ assunto da $X$ per cui $F_X(x_m)=\frac{1}{2}$. E' un caso particolare di percentile p ($p\in[0,1]$), ovvero il minimo valore $x_p$ assunto da $X$ per cui $F_X(x_p)=p$.

Classificazione delle variabili aleatorie

Una V.A. si dice:

  • CONTINUA se $F_X(x)$ è continua per tutti i valori di $x\in\mathbb{R}$
  • DISCRETA se $F_X(x)$ è costante a tratti
  • MISTA se $F_X(x)$ non è nè continua nè costante a tratti

Relazione tra funzione di distribuzione e funzione di ripartizione

Dopo aver letto qui cos'è la funzione di densità di probabilità (PDF), vediamo come ricavare la CDF in un punto generico a partire dalla PDF nei vari casi.

Vediamo

Se $X$ è una V.A. discreta, che assume i valori $x_1,\dots ,x_n$, considerato un generico valore $x_k$, si ha:

$$F_X(x_k)\mathop =\limits ^\mbox{def.}P(X\leq x_k)=P(X=x_1)+P(X=x_2)\dots +P(X=x_k)=\sum_{i=1}^kP(X=x_i)=\sum_{i=1}^kf(x_i)$$

Questo vuol dire che la funzione di ripartizione calcolata in un generico punto $x_k$ è la somma delle funzioni di densità di probabilità calcolate a partire da $x_1$ fino a $x_k$.

Se, invece $X$ è una V.A. continua, che assume valori in un certo intervallo $(a,b)$ (potendo essere $a$, $b$ numeri o $\pm\infty$), considerato un generico valore $x\in(a,b)$, si ha:

$$F_X(x)\mathop =\limits ^\mbox{def.}P(X\leq x)=\int_a^x f(t)\ dt$$

Vedi esercizi svolti

10.000 esercizi
formazione completa

Eserciziari di Matematica Generale, Analisi I e II, Statistica, Fisica e Algebra Lineare

Leggi tutto

Statistica
Video corsi

Video corso R per ricercatori e professionisti

Leggi tutto
Il quaderno degli appunti
Statistica e Probabilità

Indice di connessione di Mortara

L'indice di Mortara è un indice utilizzato per misurare il grado di connessione o associazione tra due variabili X e Y qualitative nominali o categor
Statistica e Probabilità

Indice di connessione Chi-quadrato

Il Chi-quadrato è l'indice di connessione più utilizzato in statistica per valutare l'associazione tra due variabili categoriali o qualitative. Ad
Statistica e Probabilità

Indice V di Cramer

L'indice di Cramer è un indice di connessione normalizzato usato per stabilire il grado di associazione tra due variabili qualitative nominali X eY.