La covarianza su Excel
In questa lezione ti spiego come si calcola la covarianza sul foglio Excel.
Cos'è la covarianza? La covarianza è un valore numerico che misura la dipendenza lineare tra due variabili statistiche X e Y. La formula della covarianza è la seguente: $$ \sigma_{X,Y} = \frac{\sum_{i=1}^n \ (x_i - \mu_X) \cdot (y_i - \mu_y)}{n} $$ Dove μX e μY sono la media aritmetica dei valori nelle due variabili. Quando due variabili sono indipendenti tra loro la covarianza è nulla. Se variano nello stesso senso la covarianza è positiva. Se variano in senso opposto la covarianza è negativa.
Per calcolare la covarianza su Excel usa la funzione
=COVARIANZA.P(X;Y)
Gli argomenti X e Y della funzione sono le due variabili statistiche. Possono essere numeri o intervalli di celle del foglio.
La funzione calcola la covarianza (dipendenza) tra le due variabili statistiche.
Nota. Dal punto di vista matematico la covarianza è il prodotto degli scarti delle due variabili statistiche rispetto alle rispettive medie aritmetiche.
Ti faccio un esempio pratico.
Digita i valori della variabile X nell'intervallo B2:B6 del foglio di calcolo.
Poi digita i valori della variabile Y nell'intervallo D2:D6
Nota. Le due variabili devono avere lo stesso numero di elementi. In caso contrario la funzione =COVARIANZA.P() restituisce un messaggio di errore #N/D.
Digita la funzione =COVARIANZA.P(B3:B7;D3:D7) nella cella B9
La funzione calcola la covarianza tra le variabili statistiche X e Y.
In questo caso la covarianza è uguale a 4.
E' un numero positivo perché le due sequenze di numeri sono entrambe crescenti.
Verifica. Se vuoi puoi verificare la correttezza del calcolo. Le medie aritmetiche μX e μY delle variabili statistiche X e Y sono rispettivamente μX=3 e μY=6 $$ \mu_X = \frac{1+2+3+4+5}{5} = 3 $$ $$ \mu_X = \frac{2+4+6+8+10}{5} = 6 $$ Ora calcola la covarianza tramite la formula $$ \sigma_{X,Y} = \frac{\sum_{i=1}^n \ (x_i - \mu_X) \cdot (y_i - \mu_y)}{n} $$ $$ \sigma_{X,Y} = \frac{ (1 - \mu_X) \cdot (2 - \mu_y) + (2 - \mu_X) \cdot (4 - \mu_y) + (3 - \mu_X) \cdot (6 - \mu_y)+ }{n} \\ \ \ \ \ \ \ \ \ \frac{+(4 - \mu_X) \cdot (8 - \mu_y)+ (5 - \mu_X) \cdot (10 - \mu_y)}{n} $$ Entrambe le variabili statistiche hanno n=5 elementi e le medie aritmetiche sono μX=3 e μY=6 $$ \sigma_{X,Y} = \frac{ (1 - 3) \cdot (2 - 6) + (2 - 3 \cdot (4 - 6) + (3 - 3) \cdot (6 - 6)+ }{5} \\ \ \ \ \ \ \ \ \ \frac{+(4 - 3) \cdot (8 - 6)+ (5 - 3) \cdot (10 - 6)}{5} $$ $$ \sigma_{X,Y} = \frac{ (-2) \cdot (-4) + (-1) \cdot (-2) + (0) \cdot (0)+(1) \cdot (2)+ (2) \cdot (4) }{5} $$ $$ \sigma_{X,Y} = \frac{ 8 + 2+ 0 + 2 + 8 }{5} $$ $$ \sigma_{X,Y} = \frac{ 20 }{5} $$ $$ \sigma_{X,Y} = 4 $$ La covarianza è uguale a 4. Le due variabili statistiche X e Y variano nello stesso senso. In questo caso sono entrambe crescenti.
Ti faccio un altro esempio.
Modifica i dati della variabile Y in modo decrescente.
La funzione =COVARIANZA.P(B3:B7;D3:D7) nella cella B9 si aggiorna automaticamente.
Adesso la covarianza è -4. E' un numero negativo perché le due variabili statistiche si muovono in senso opposto.
Nota. Senza rifare i calcoli guarda l'andamento grafico delle due variabili statistiche. La variabile statistica X è crescente mentre la variabile statistica Y è decrescente. C'è ancora una dipendenza lineare tra le due variabili ma in senso opposto.
Ti faccio un ultimo esempio.
Modifica i dati della variabile X facendo in modo che sia crescente fino alla metà e poi decrescente.
La funzione =COVARIANZA.P(B3:B7;D3:D7) nella cella B9 si aggiorna in automatico.
Adesso la covarianza è uguale a 0.
E' nulla perché non c'è alcuna dipendenza lineare tra le due variabili.
Verifica. La prima variabile statistica X è crescente mentre la seconda variabile statistica Y è inizialmente crescente e poi decrescente. Non hanno lo stesso andamento. Quindi non c'è alcuna dipendenza lineare tra loro.
Tutte le variabili statistiche indipendenti hanno la covarianza uguale a zero. Ricorda però che non vale anche il contrario. Se la covarianza è nulla non è detto che le due variabili siano indipendenti.
In questo modo puoi calcolare la covarianza su Excel.