L'intervallo di confidenza su Excel
In questa guida ti spiego come calcolare l'intervallo di confidenza sul foglio Excel.
Cos'è l'intervallo di confidenza? E' un intervallo di valori all'interno del quale è molto probabile trovare un determinato valore della distribuzione. Ad esempio, la media di una distribuzione normale si trova al 95% in questo intervallo $$ \begin{pmatrix} \mu - 1,96 \cdot \frac{\sigma}{ \sqrt{n} } \ \ , \ \ \mu + 1,96 \cdot \frac{\sigma}{ \sqrt{n} } \end{pmatrix} $$ Dove sigma σ è la devianza standard della popolazione e μ è la media calcolata su un campione di n elementi estratto dalla popolazione.
Per calcolare l'intervallo di confidenza su Excel devi usare la funzione =CONFIDENZA.NORM()
=CONFIDENZA.NORM(alfa;dev_standard;dimensione)
La funzione ha tre parametri
- alfa è il livello di significatività e indica la probabilità di compiere un errore. Ad esempio, per avere una probabilità del 95% (p=0,95) che un valore si trovi nell'intervallo di confidenza devi indicare alfa =0,05.
- dev_standard è la deviazione standard della popolazione da cui hai estratto un campione. Si presuppone noto.
- dimensione è il numero di unità di cui è composto il campione che hai estratto dalla popolazione
La funzione CONFIDENZA.NORM() calcola l'intervallo di confidenza della media della distribuzione.
Nota. Nelle versioni più datate di Excel puoi usare la funzione =CONFIDENZA() usando gli stessi parametri. Quest'ultima funzione è attiva anche nelle versioni più recenti di Excel per garantire la retroattività dei vecchi fogli di calcolo.
Ti faccio un esempio pratico.
Supponi di avere i dati di una popolazione composta da 100.000 studenti di cui conosci l'altezza di ogni singolo individuo.
Non conosci la media dell'altezza (μP) della popolazione e non hai tempo di calcolarla.
Tuttavia, conosci che la popolazione ha una deviazione standard σ=0,3 sulla modalità "altezza"
Poi d
Per stimare l'altezza estrai dalla popolazione un campione con i dati di n=30 persone.
Poi calcola la media dell'altezza nel campione.
Ad esempio, supponi che la media nel campione di trenta persone sia μ=1,75 cm
Ora digita la funzione =CONFIDENZA.NORM(0,05;0,3;30) nella cella C8
Questa funzione trova l'intervallo di confidenza della media del campione con una probabilità del 95%
In questo caso l'intervallo di confidenza è x=0,107351649 che approssimo a x=0,11
Vuol dire che al 95% il valore effettivo della media della popolazione μP è compreso nell'intervallo (μ-x,μ+x)
Dove μ=1,75 cm è la media del campione di 30 persone e x=0,11 è l'intervallo di confidenza
$$ (1,75 - 0,11 \ , \ 1,75 + 0,11 ) $$
$$ (1,64 \ , \ 1,86 ) $$
Vuol dire che la media dell'altezza nella popolazione è compresa tra 1,64 cm e 1,86 cm con una probabilità del 95%.
Tuttavia, è decisamente troppo ampio come intervallo.
Per restringerlo prova ad aumentare il livello di significatività da 0,05 a 0,4.
Digita la funzione =CONFIDENZA.NORM(0,4;0,3;30) nella cella C9
Questa funzione calcola l'intervallo di confidenza intorno alla media del campione con una probabilità del 60%
Ora l'intervallo di confidenza è x=0,046097493 che approssimo a x=0,05
Nota. Il livello di significatività (probabilità di errore) è aumentato a 0,4 ossia al 40%. Pertanto, la probabilità che il valore medio si trovi effettivamente nell'intervallo di confidenza è del 60%.
Pertanto, con una probabilità del 60% il valore effettivo della media della popolazione μP è compreso nell'intervallo (μ-x,μ+x)
Dove μ=1,75 cm è la media del campione di 30 persone e x=0,05 è l'intervallo di confidenza
$$ (1,75 - 0,05 \ , \ 1,75 + 0,05 ) $$
$$ (1,70 \ , \ 1,80 ) $$
Vuol dire che la media dell'altezza nella popolazione è compresa tra 1,70 cm e 1,80 cm con una probabilità del 60%.
E' un esempio pratico di calcolo dell'intervallo di confidenza sul foglio Excel.