Tutorial de regressão linear
Neste tutorial, vamos abordar o tópico de Análise de regressão . Veja abaixo uma lista de exemplos de problemas relevantes, com soluções passo a passo.
Problemas de regressão linear de amostra
Questão 1: As fórmulas para a menor linha quadrada foram encontradas resolvendo o sistema de equações
Resolva essas equações para b e m para mostrar que
Solução: A partir de
temos duas equações e duas incógnitas (m e b)
Conseguimos isso multiplicando a primeira equação por e a segunda por -n, obtemos
e agora adicionando estes:
Agora, a partir desta equação:
nós podemos resolver para b :
Questão 2: Determine o coeficiente de correlação e faça um gráfico da linha de regressão com o coeficiente de regressão para o seguinte conjunto de dados.
Incêndios florestais e hectares queimados. O número de incêndios e o número de hectares queimados são os seguintes
Incêndios (x) |
72 |
69 |
58 |
47 |
84 |
62 |
57 |
45 |
Acres (y) |
62 |
41 |
19 |
26 |
51 |
15 |
30 |
15 |
Solução: (a) O seguinte gráfico de dispersão é obtido:
Com base no gráfico de dispersão acima, observamos que existe um grau moderado a forte de associação linear positiva.
(b) Por outro lado, temos a seguinte tabela que mostra os cálculos necessários para calcular a correlação de Pearson: Obtemos
X |
Y |
X² |
Y² |
X · Y |
|
72 |
62 |
5184 |
3844 |
4464 |
|
69 |
41 |
4761 |
1681 |
2829 |
|
58 |
19 |
3364 |
361 |
1102 |
|
47 |
26 |
2209 |
676 |
1222 |
|
84 |
51 |
7056 |
2601 |
4284 |
|
62 |
15 |
3844 |
225 |
930 |
|
57 |
30 |
3249 |
900 |
1710 |
|
45 |
15 |
2025 |
225 |
675 |
|
Soma |
494 |
259 |
31692 |
10513 |
17216 |
A correlação de Pearson r é calculada como
(c) O coeficiente de determinação é
o que significa que 59,17% da variação em Acres (y) é explicada por Fogos (x).
(d) Os coeficientes de regressão são calculados
and
Isso significa que a equação de regressão é
Graphically:
Questão 3: Você conduziu um estudo para determinar se o tempo médio gasto no laboratório de informática a cada semana e a nota do curso em um curso de informática estavam correlacionados. Usando os dados fornecidos a seguir, que conclusão você tiraria sobre esse assunto?
student
|
# hours in lab
|
Course Grade
|
1
|
20
|
96
|
2
|
11
|
51
|
3
|
16
|
62
|
4
|
13
|
58
|
5
|
89
|
|
6
|
15
|
81
|
7
|
10
|
46
|
8
|
10
|
51
|
Solução: A tabela a seguir mostra os cálculos necessários para calcular Pearson Correr : Nós temos
X
|
Y
|
X²
|
Y²
|
X·Y
|
|
20
|
96
|
400
|
9216
|
1920
|
|
11
|
51
|
121
|
2601
|
561
|
|
16
|
62
|
256
|
3844
|
992
|
|
13
|
58
|
169
|
3364
|
754
|
|
17
|
89
|
289
|
7921
|
1513
|
|
15
|
81
|
225
|
6561
|
1215
|
|
10
|
46
|
100
|
2116
|
460
|
|
10
|
51
|
100
|
2601
|
510
|
|
Sum
|
112
|
534
|
1660
|
38224
|
7925
|
A correlação de Pearson r é calculada como
Queremos testar a significância do coeficiente de correlação. Mais especificamente, queremos testar
Para testar a hipótese nula, definiu um teste t. A estatística t é calculada como
O valor p de duas caudas para este teste é válido como
Desde , e isso significa que rejeitamos a hipótese nula H 0 .
Portanto, existem evidências para apoiar uma afirmação de que a correlação entre o número de horas no laboratório e a nota do curso é diferente de zero.