Sia $X$ una variabile aleatoria di speranza matematica $\mu$ e varianza $\sigma$ e $k$ un numero reale positivo, allora il teorema di Cebicev afferma che la probabilità che $X$ assuma un valore compreso tra $\mu-k\sigma$ e $\mu+k\sigma$ è maggiore di $1-\cfrac{1}{k^2}$. In simboli:
$$\bbox[#ffffff,5px,border:2px solid #ff6600]{P(\mu-k\sigma \le X \le \mu+k\sigma)\ge 1-\cfrac{1}{k^2}}\quad (\large\star )$$
che equivale alla disuguaglianza $$P(|X-\mu|\ge k\cdot\sigma)\le\cfrac{1}{k^2}$$
Nell'ambito della statistica descrittiva, la disuguaglianza di Cebicev afferma che almeno il $\left(1-\cfrac{1}{k^2}\right)\cdot 100\%$ dei valori è nell'intervallo sopra detto.
Da questa disuguaglianza si deduce che:
- almeno il 75% dei valori sono compresi tra $\mu-2\sigma$ e $\mu+2\sigma$
- almeno il 89% dei valori sono compresi tra $\mu-3\sigma$ e $\mu+3\sigma$
- almeno il 94% dei valori sono compresi tra $\mu-4\sigma$ e $\mu+4\sigma$
- almeno il 96% dei valori sono compresi tra $\mu-5\sigma$ e $\mu+5\sigma$
- almeno il 99% dei valori sono compresi tra $\mu-10\sigma$ e $\mu+10\sigma$
indipendentemente da come sono distribuiti i valori.
Altra formulazione della disuguaglianza di Cebicev
Considerando $\varepsilon$ un valore reale posititivo, la disuguaglianza di Cebicev proviene dalla disuguaglianza di Markov:
$$P(X\geq\varepsilon)\leq\cfrac{E[X]}{\varepsilon}$$
Infatti, applicando tale disuguaglianza alla variabile aleatoria $(X-E[X])^2$, otteniamo:
$$\begin{array}{l} P((X-E[X])^2\geq\varepsilon^2)\leq\cfrac{E[(X-E[X])^2]}{\varepsilon^2}\\ P(|X-E[X]|\geq\varepsilon)\leq\cfrac{VAR(X)}{\varepsilon^2}\\ P(|X-E[X]|\leq\varepsilon)\geq 1-\cfrac{VAR(X)}{\varepsilon^2}\end{array}$$
Quest'ultima disuguaglianza ottenuta, è l'equivalente della $\large\star$ con $k=\cfrac{\varepsilon}{\sigma}$.
Applicazione della disuguaglianza di Cebicev
I tubi di acciaio di un lotto hanno diametro, in millimetri, avente media aritmetica pari a 100 e varianza pari a 4. Un tubo è considerato difettoso se il suo diametro è inferiore a 90mm o superiore a 110mm; il lotto viene rifiutato e rinviato al produttore se contiene più del 6% di tubi difettosi. Sulla base delle informazioni a disposizione, il lotto andrà accettato o rifiutato?
Svolgimento
Poiché l'intervallo $(90;110)$ si può scrivere come $(100-5\cdot2;100+5\cdot2)$, per il teorema di Cebicev, almeno il $\left(1-\cfrac{1}{5^2}\right)\cdot 100\%=96\%$ dei dati è in tale intervallo; di conseguenza al più il $4\%$ dei dati è maggiore di 110mm o minore di 90mm. Il lotto andrà accettato!