Problemas de Regresión Lineal
Problemas de Regresión Lineal
Doctoral.
2021-2022
Ejercicio 1
Tienda 1 2 3 4 5 6 7 8 9 10
Número de
pedidos 50 56 60 68 65 50 79 35 42 15
Número de
ventas 45 55 50 65 60 40 75 30 38 12
Estadisticas descriptivas
Media Desviación N
Número 47.00 18.251 10
de Ventas
Coeficientes
Modelo Coeficientes Coeficientes 95,0%
desentandarizado estandarizado intervalo de
s s confianza B
Upper
Std. Lower Boun
B Error Beta T Sig. Bound d
1 (Constant -4.324 3.074 -1.407 . - 2.765
) 197 11.413
Número .987 .056 .987 17.59 . .858 1.116
de 8 000
Pedidos
y= a +bx
y= -4,324+0,987x
ANOVA
Modelo Suma de
cuadrado Cuadrado
s Df medio F Sig.
1 Regressio 2922.507 1 2922.507 309.698 .000
n
Residual 75.493 8 9.437
Total 2998.000 9
Esta tabla nos indica si existe o no relación significativa entre las variables. El
estadístico F permite contrastar la hipótesis nula de que el valor poblacional de
R es cero, lo cual, en el modelo de regresión simple, equivale a contrastar la
hipótesis de de que la pendiente de la regresión vale cero. El nivel crítico (Sig.)
indica que, si suponemos que el valor poblacional de R es cero, es improbable
(probabilidad = 0, 000) que R, en esta muestra, tome el valor de 0,98. Lo cual
implica que R es mayor que cero y que, en consecuencia, ambas variables
están linealmente relacionadas.
Una vez obtenida la recta que minimiza la suma del cuadrado de los residuos,
se necesita conocer la bondad del ajuste, es decir en qué medida esta recta
obtenida se ajusta más o menos a la nube de puntos. El coeficiente de
determinación “R2” se ha impuesto entre el resto. El coeficiente de
determinación es el cuadrado del coeficiente de correlación múltiple y sus
valores se mueven entre -1 y 1, donde 0 es que no existe ninguna relación y 1
que existe la máxima relación positiva. El coeficiente de determinación
representa la ganancia que obtenemos al predecir una variable basándonos en
el conocimiento que tenemos de otra u otras variables.
Resumen modelo
Modelo Equilibrio Error de la
R. R estimacio Durbin-
R cuadrado cuadrado n Watson
1 .987 .975 .972 3.072 2.955
Estadísticas de residual
Std.
Desviacio
Minimo Maximo Medio n N
Valor 10.48 73.65 47.00 18.020 10
previsto
Residual -5.026 4.052 .000 2.896 10
Std. -2.027 1.479 .000 1.000 10
Valor
previsto
Std. -1.636 1.319 .000 .943 10
Residual
d) ¿Qué puede usted concluir acerca de la correlación poblacional
entre gastos generales y unidades producidas?
Ejercicio 2
Edad (año) 25 46 58 37 55 32 41 50 23 69
Ausentismo
(días por
año) 18 12 8 15 10 13 7 9 16 6
a) Use el método de los mínimos cuadrados para hallar la ecuación
muestral que relaciona las dos variables.
Bajo este criterio se calcula la constante y pendiente que debe tener la recta.
Este método busca la recta que minimiza la suma del cuadrado de los residuos.
Los residuos se calculan como la diferencia entre los valores observados y los
valores ajustados por la regresión.
Estadísticas descriptivas
Std.
Deviacio
medio n N
Ausentismo 11.40 4.061 10
s
Edad 42.70 13.334 10
(años)
Correlationes
Edad
Ausentismos (años)
Ausentismos 1.000 -.853
Edad (años) -.853 1.000
Ausentismos . .001
Edad (años) .001 .
Ausentismos 10 10
Edad (años) 10 10
ANOVAb
Model Sum of Mean
Squares df Square F Sig.
1 Regressio 108.049 1 108.049 21.422 .002
n
Residual 40.351 8 5.044
Total 148.400 9
Coeficientes
Modelo Coeficientes Coeficientes 95,0%
desestandarizado estandarizado coeficiente de
s s intervalo B
Std. Lower Upper
B Error Beta t Sig. Bound Bound
1 (Constante 22.496 2.500 8.997 . 16.73 28.26
) 000 0 2
Edad -.260 .056 -.853 - . -.389 -.130
(años) 4.628 002
Estadística residual
Std.
Minimo Máximo Medio Deviacion N
Valor 6.90 16.52 11.40 3.465 10
previsto
Residual -4.842 2.119 .000 2.117 10
Std. Valor -1.297 1.477 .000 1.000 10
previsto
Std. -2.156 .943 .000 .943 10
Residual
y= a +bx
y= 22,496-0,260x