La regressione lineare REGR.LIN

La regressione lineare REGR.LIN

Giugno 9, 2021 Off Di excelsapeviche

Vi siete mai chiesti come funziona La regressione lineare REGR.LIN? Avete sempre utilizzato la funzione REGR.LIN, ma non avete mai avuto modo di andare a fondo su come funzioni? Excelsapeviche vi racconta una delle funzioni statistiche più celebri e utilizzate di excel e vi mostra i dettagli.

Per prima cosa specifichiamo che la regressione lineare (in due dimensioni, come nel caso che tratteremo sotto per intenderci) si chiama così in quanto si tratta della retta che passa “più vicino possibile” a tutti i punti (x,y), cioè a tutte le osservazioni. E la retta è descritta in due dimensioni dalla funzione lineare y=βx+α.

Iniziamo col vedere come è composta e a cosa serve la funzione nativa per La regressione lineare REGR.LIN di excel. Supponiamo di avere la variabile indipendente età e la variabile dipendente stipendio medio, cioè quella di cui vogliamo stimare il valore

Mostriamo qui di seguito la distribuzione delle coppie ordinate (Età,Stipendio medio) nel grafico cartesiano

regressione lineare

La funzione statistica per La regressione lineare REGR.LIN stima tramite il metodo dei minimi quadrati i parametri α e β che servono per definire univocamente la famosa retta di regressione, detta anche retta dei minimi quadrati. In statistica α si chiama intercetta e indica in qualche modo l’altezza della retta, mentre β rappresenta la sua pendenza. Gli argomenti della funzione REGR.LIN sono i seguenti:

  • y_nota: è obbligatorio ed è l’insieme dei valori osservati della variabile dipendente, nel nostro caso i valori di Stipendio medio
  • x_nota: è facoltativo, ma che è sempre meglio mettere, ed è l’insieme dei valori della variabile dipendente, nel nostro caso l’Età
  • cost: è facoltativo ed è un booleano, VERO o FALSO, che serve per specificare se vogliamo che la α sia 0 (nel caso di FALSO) oppure no, in pratica se vogliamo che la nostra retta di regressione passi per l’origine degli assi oppure no. Il valore di default è VERO
  • stat: è facoltativo ed è un booleano che specifica se restituire statistiche aggiuntive di regressione (per i dettagli su questo vi rimandiamo al sito di supporto della Microsoft)

Vediamo quindi l’utilizzo della funzione REGR.LIN nel nostro esempio

=REGR.LIN(Foglio1!B2:B12;Foglio1!A2:A12)

La funzione REGR.LIN come abbiamo detto restituisce i due parametri che servono per definire la retta di regressione, quindi per il risultato della funzione abbiamo bisogno di due celle, una per la α e una per la β. Per fare questo dobbiamo cliccare su ctrl+shift+invio per eseguirla

regressione lineare excel

In questo modo vedrete apparire delle parentesi graffe attorno alla funzione. Grazie alla funzione REGR.LIN abbiamo quindi ottenuto la retta di regressione per il nostro esempio: y = 93,636x – 1477,272.

E’ possibile ottenere la retta di regressione anche tramite gli elementi del grafico a dispersione, aggiungendo la linea di tendenza lineare

regressione lineare excel

Da opzioni linea di tendenza potete facilmente visualizzare l’equazione della retta di regressione.

Ma noi vogliamo entrare nel cuore della regressione lineare, vogliamo quindi replicare “a mano” i calcoli sottostanti la funzione REGR.LIN.

Iniziamo specificando che tramite la retta di regressione possiamo calcolare, data un’età, lo stipendio medio stimato per quell’età. Quindi è chiaro che tra lo stipendio medio osservato e tra quello stimato c’è in generale un delta, chiamato errore ε

y stimato –> y’ = α + βx
y osservato –> y = α + βx + ε

Con il metodo dei minimi quadrati non si fa altro che trovare α e β che minimizzano la somma degli errori al quadrato Σεi2. Per fare questo sono necessari diversi passaggi matematici, per cui vi rimandiamo a Wikipedia, dove potete trovare un’ottima spiegazione. Grazie all’algoritmo dei minimi quadrati si ricavano le formule per α e β

linear regression formula
linear regression formula 2

Nell’immagine sottostante trovate sia il calcolo manuale che quello tramite la funzione per La regressione lineare REGR.LIN

Se siete interessati vi possiamo fornire il file excel con i calcoli per la retta di regressione nei tre modi visti in questo articolo.

Ricapitolando, in questo articolo abbiamo visto e capito le potenzialità della funzione per La regressione lineare REGR.LIN, nell’ambito delle funzioni statistiche di excel. Per qualsiasi dubbio, informazione, o se vi siete mai chiesti qualcosa su excel che nessuno è riuscito a spiegarvi, contattateci!