lettura facile

La covarianza su Excel

In questa lezione ti spiego come si calcola la covarianza sul foglio Excel.

Cos'è la covarianza? La covarianza è un valore numerico che misura la dipendenza lineare tra due variabili statistiche X e Y. La formula della covarianza è la seguente: $$ \sigma_{X,Y} = \frac{\sum_{i=1}^n \ (x_i - \mu_X) \cdot (y_i - \mu_y)}{n} $$ Dove μX e μY sono la media aritmetica dei valori nelle due variabili. Quando due variabili sono indipendenti tra loro la covarianza è nulla. Se variano nello stesso senso la covarianza è positiva. Se variano in senso opposto la covarianza è negativa.

Per calcolare la covarianza su Excel usa la funzione

=COVARIANZA.P(X;Y)

Gli argomenti X e Y della funzione sono le due variabili statistiche. Possono essere numeri o intervalli di celle del foglio.

La funzione calcola la covarianza (dipendenza) tra le due variabili statistiche.

Nota. Dal punto di vista matematico la covarianza è il prodotto degli scarti delle due variabili statistiche rispetto alle rispettive medie aritmetiche.

Ti faccio un esempio pratico.

Digita i valori della variabile X nell'intervallo B2:B6 del foglio di calcolo.

digita la variabile X

Poi digita i valori della variabile Y nell'intervallo D2:D6

digita la variabile Y

Nota. Le due variabili devono avere lo stesso numero di elementi. In caso contrario la funzione =COVARIANZA.P() restituisce un messaggio di errore #N/D.

Digita la funzione =COVARIANZA.P(B3:B7;D3:D7) nella cella B9

digita =COVARIANZA(B2:B6;D2:D6)

La funzione calcola la covarianza tra le variabili statistiche X e Y.

In questo caso la covarianza è uguale a 4.

E' un numero positivo perché le due sequenze di numeri sono entrambe crescenti.

la covarianza è 4

Verifica. Se vuoi puoi verificare la correttezza del calcolo. Le medie aritmetiche μX e μY delle variabili statistiche X e Y sono rispettivamente μX=3 e μY=6 $$ \mu_X = \frac{1+2+3+4+5}{5} = 3 $$ $$ \mu_X = \frac{2+4+6+8+10}{5} = 6 $$ Ora calcola la covarianza tramite la formula $$ \sigma_{X,Y} = \frac{\sum_{i=1}^n \ (x_i - \mu_X) \cdot (y_i - \mu_y)}{n} $$ $$ \sigma_{X,Y} = \frac{ (1 - \mu_X) \cdot (2 - \mu_y) + (2 - \mu_X) \cdot (4 - \mu_y) + (3 - \mu_X) \cdot (6 - \mu_y)+ }{n} \\ \ \ \ \ \ \ \ \ \frac{+(4 - \mu_X) \cdot (8 - \mu_y)+ (5 - \mu_X) \cdot (10 - \mu_y)}{n} $$ Entrambe le variabili statistiche hanno n=5 elementi e le medie aritmetiche sono μX=3 e μY=6 $$ \sigma_{X,Y} = \frac{ (1 - 3) \cdot (2 - 6) + (2 - 3 \cdot (4 - 6) + (3 - 3) \cdot (6 - 6)+ }{5} \\ \ \ \ \ \ \ \ \ \frac{+(4 - 3) \cdot (8 - 6)+ (5 - 3) \cdot (10 - 6)}{5} $$ $$ \sigma_{X,Y} = \frac{ (-2) \cdot (-4) + (-1) \cdot (-2) + (0) \cdot (0)+(1) \cdot (2)+ (2) \cdot (4) }{5} $$ $$ \sigma_{X,Y} = \frac{ 8 + 2+ 0 + 2 + 8 }{5} $$ $$ \sigma_{X,Y} = \frac{ 20 }{5} $$ $$ \sigma_{X,Y} = 4 $$ La covarianza è uguale a 4. Le due variabili statistiche X e Y variano nello stesso senso. In questo caso sono entrambe crescenti.
il grafico delle due variabili statistiche

Ti faccio un altro esempio.

Modifica i dati della variabile Y in modo decrescente.

modifica i dati della variabile Y

La funzione =COVARIANZA.P(B3:B7;D3:D7) nella cella B9 si aggiorna automaticamente.

Adesso la covarianza è -4. E' un numero negativo perché le due variabili statistiche si muovono in senso opposto.

La covarianza è -4

Nota. Senza rifare i calcoli guarda l'andamento grafico delle due variabili statistiche. La variabile statistica X è crescente mentre la variabile statistica Y è decrescente. C'è ancora una dipendenza lineare tra le due variabili ma in senso opposto.
le due variabili si muovono in senso opposto

Ti faccio un ultimo esempio.

Modifica i dati della variabile X facendo in modo che sia crescente fino alla metà e poi decrescente.

modifica i dati della variabile Y

La funzione =COVARIANZA.P(B3:B7;D3:D7) nella cella B9 si aggiorna in automatico.

Adesso la covarianza è uguale a 0.

E' nulla perché non c'è alcuna dipendenza lineare tra le due variabili.

la covarianza è nulla

Verifica. La prima variabile statistica X è crescente mentre la seconda variabile statistica Y è inizialmente crescente e poi decrescente. Non hanno lo stesso andamento. Quindi non c'è alcuna dipendenza lineare tra loro.
le due variabili statistiche non hanno lo stesso andamento
Tutte le variabili statistiche indipendenti hanno la covarianza uguale a zero. Ricorda però che non vale anche il contrario. Se la covarianza è nulla non è detto che le due variabili siano indipendenti.

In questo modo puoi calcolare la covarianza su Excel.

 

 




Non hai risolto il tuo problema? Scrivi una domanda




FacebookTwitterLinkedinLinkedin