Esercitazione sulla regressione lineare
In questo tutorial, tratteremo l'argomento di Analisi di regressione . Vedere di seguito un elenco di problemi di esempio rilevanti, con soluzioni passo passo.
Esempi di problemi di regressione lineare
Domanda 1: Le formule per la linea dei minimi quadrati sono state trovate risolvendo il sistema di equazioni
Risolvi queste equazioni per b e m per dimostrarlo
Soluzione: A partire dal
abbiamo due equazioni e due incognite (me b)
Lo otteniamo moltiplicando la prima equazione per e la seconda per -n otteniamo
e ora aggiungendo questi:
Ora, da questa equazione:
possiamo risolvere per b :
Domanda 2: Determinare il coefficiente di correlazione e fare un grafico della linea di regressione con il coefficiente di regressione per il seguente insieme di dati.
Incendi boschivi e acri bruciati. Il numero di incendi e il numero di acri bruciati sono i seguenti
Incendi (x) |
72 |
69 |
58 |
47 |
84 |
62 |
57 |
45 |
Acri (y) |
62 |
41 |
19 |
26 |
51 |
15 |
30 |
15 |
Soluzione: (a) Si ottiene il seguente grafico a dispersione:
Sulla base del grafico a dispersione sopra, osserviamo che esiste un grado da moderato a forte di associazione lineare positiva.
(b) D'altra parte, abbiamo la seguente tabella che mostra i calcoli necessari per calcolare la correlazione di Pearson: Otteniamo
X |
Y |
X² |
Y² |
X · Y |
|
72 |
62 |
5184 |
3844 |
4464 |
|
69 |
41 |
4761 |
1681 |
2829 |
|
58 |
19 |
3364 |
361 |
1102 |
|
47 |
26 |
2209 |
676 |
1222 |
|
84 |
51 |
7056 |
2601 |
4284 |
|
62 |
15 |
3844 |
225 |
930 |
|
57 |
30 |
3249 |
900 |
1710 |
|
45 |
15 |
2025 |
225 |
675 |
|
Somma |
494 |
259 |
31692 |
10513 |
17216 |
La correlazione di Pearson r è calcolata come
(c) Il coefficiente di determinazione è
il che significa che il 59,17% della variazione in Acres (y) è spiegato da Fires (x).
(d) Vengono calcolati i coefficienti di regressione
and
Ciò significa che l'equazione di regressione è
Graphically:
Domanda 3: Hai condotto uno studio per determinare se il tempo medio trascorso nel laboratorio informatico ogni settimana e il voto del corso in un corso di computer fossero correlati. Utilizzando i dati forniti di seguito, quale conclusione trarresti su questo problema?
student
|
# hours in lab
|
Course Grade
|
1
|
20
|
96
|
2
|
11
|
51
|
3
|
16
|
62
|
4
|
13
|
58
|
5
|
89
|
|
6
|
15
|
81
|
7
|
10
|
46
|
8
|
10
|
51
|
Soluzione: La tabella seguente mostra i calcoli necessari per calcolare Pearson correlazione r : Noi abbiamo
X
|
Y
|
X²
|
Y²
|
X·Y
|
|
20
|
96
|
400
|
9216
|
1920
|
|
11
|
51
|
121
|
2601
|
561
|
|
16
|
62
|
256
|
3844
|
992
|
|
13
|
58
|
169
|
3364
|
754
|
|
17
|
89
|
289
|
7921
|
1513
|
|
15
|
81
|
225
|
6561
|
1215
|
|
10
|
46
|
100
|
2116
|
460
|
|
10
|
51
|
100
|
2601
|
510
|
|
Sum
|
112
|
534
|
1660
|
38224
|
7925
|
La correlazione di Pearson è calcolata come
Vogliamo verificare la significatività del coefficiente di correlazione. Più specificamente, vogliamo testare
Per verificare l'ipotesi nulla, utilizziamo un test t. La statistica è calcolata come
Il valore p a due code per questo test viene calcolato come
Dal momento che , e questo significa che rifiutiamo l'ipotesi nulla H 0 .
Quindi, abbiamo prove sufficienti per sostenere l'affermazione che la correlazione tra il numero di ore in laboratorio e il grado del corso è buoni diversi da zero.