Spesso capita di vedere delle analisi di correlazione ed in particolare grafici con retta di regressione che lasciano senza parole! E questo in moltissimi campi e settori!
Il grafico sotto ne è un esempio lampante. Quando si chiede ad Excel di inserire una retta di regressione (linea di tendenza) su di un insieme di punti, il software farà il suo dovere proponendone una, sempre e comunque.
L’utente meno attento concluderà che vi è una correlazione positiva tra le due variabili (X e Y) riportate nel grafico. Tuttavia oltre alla retta e alla sua inclinazione, va in primis valutato il valore di R-quadro ovvero il parametro che esprime la percentuale di variabilità spiegata dal modello (ad esempio r=0,8 indica che il modello spiega l’80% della variabilità). Per R inferiori a 0,6 si può concludere che il modello non spiega granché…per R-quadro inferiori a 0,3 possiamo dire che il modello è puramente “estetico”.
Per la cronaca, il grafico riportato nell’immagine rappresenta una generazione casuale di valori 100 valori tra 30 e 100 (di fatto una nuvola di punti casuali) con l’aggiunta di un punto molto distante di coordinate X=140 e Y=140 e uno di coordinate 20, 25. Questo punto fa si che Excel generi una retta con pendenza positiva, ma in realtà il tutto non è altro che una nuvola di valori generati casualmente!
La statistica è una cosa SERIA!
Комментарии