Sia X una variabile aleatoria
La funzione $$\bbox[#ffffff,5px,border:2px solid #ff6600]{F_X(x)=P(X\leq x)\quad\quad\forall x\in\mathbb{R}}$$ è detta funzione di distribuzione o di ripartizione cumulativa (CDF) della variabile aleatoria X.
Proprietà della CDF
- $\frac{d(F_X(x))}{dx}\geq 0\quad\forall x$, ossia la CDF è una funzione non decrescente.
- $F_X(+\infty)=\lim\limits_{x\rightarrow +\infty}F_X(x)=1$
- $\begin{array}{l} F_X(-\infty)=\lim\limits_{x\rightarrow -\infty}F_X(x)=0\quad\mbox{se $X$ è una V.A. continua}\\ F_X(x)(-\infty)=\lim\limits_{x\rightarrow -\infty}F_X(x)\neq 0\quad\mbox{se $X$ è una V.A. non continua}\end{array}$
Dalle precedenti proprietà si possono dedurre le seguenti:
- $0\leq F_X(x)\leq 1\quad\forall x$.
- $P(X>x)=1-F_X(x)\quad\forall x$.
- $P(x_1\leq X\leq x_2)=F_X(x_2)-F_X(x_1)\quad\forall\ x1\leq x2$.
- $P(X=x)=0\quad\forall x$ se X è continua.
Inoltre, la mediana di $X$ è il minimo valore $x_m$ assunto da $X$ per cui $F_X(x_m)=\frac{1}{2}$. E' un caso particolare di percentile p ($p\in[0,1]$), ovvero il minimo valore $x_p$ assunto da $X$ per cui $F_X(x_p)=p$.
Classificazione delle variabili aleatorie
Una V.A. si dice:
- CONTINUA se $F_X(x)$ è continua per tutti i valori di $x\in\mathbb{R}$
- DISCRETA se $F_X(x)$ è costante a tratti
- MISTA se $F_X(x)$ non è nè continua nè costante a tratti
Relazione tra funzione di distribuzione e funzione di ripartizione
Dopo aver letto qui cos'è la funzione di densità di probabilità (PDF), vediamo come ricavare la CDF in un punto generico a partire dalla PDF nei vari casi.
Vediamo
Se $X$ è una V.A. discreta, che assume i valori $x_1,\dots ,x_n$, considerato un generico valore $x_k$, si ha:
$$F_X(x_k)\mathop =\limits ^\mbox{def.}P(X\leq x_k)=P(X=x_1)+P(X=x_2)\dots +P(X=x_k)=\sum_{i=1}^kP(X=x_i)=\sum_{i=1}^kf(x_i)$$
Questo vuol dire che la funzione di ripartizione calcolata in un generico punto $x_k$ è la somma delle funzioni di densità di probabilità calcolate a partire da $x_1$ fino a $x_k$.
Se, invece $X$ è una V.A. continua, che assume valori in un certo intervallo $(a,b)$ (potendo essere $a$, $b$ numeri o $\pm\infty$), considerato un generico valore $x\in(a,b)$, si ha:
$$F_X(x)\mathop =\limits ^\mbox{def.}P(X\leq x)=\int_a^x f(t)\ dt$$