Regresión Lineal - Segunda Parte
El siguiente conjunto de datos fue tomado sobre grupos de trabajadoras de Inglaterra y Gales en el periodo 1970 -72 . En cada uno de los 25 grupos muestreados se han observados dos variables :
El indice estandarizado de consumo de cigarrillos (x) y el indice de muertes por cáncer de pulmón (y).
A continuación se utilizará el software Excel para establecer el modelo de regresión lineal entre las variables a analizar.
En primer lugar de preferencia los datos de cada variable deben estar distribuidos en una sola columna, para facilitar la selección de datos.
Luego seleccionar en el menú Datos , la opción Análisis de Datos y luego Regresión.
Posteriormente seleccionamos nuestros datos correspondientes a la variable a predecir ( Y) y la variable independiente (X).
Activamos con un check la opción Rótulos si queremos diferenciar el encabezado de cada columna del resto de datos y finalmente hacemos click en Aceptar.
A continuación el programa nos muestra los siguientes resultados que analizaremos:
En primer lugar nos muestra el coeficiente de correlación lineal que es 0.72 que nos revela que existe una asociación lineal importante entre las variables.
Sin embargo el coeficiente de determinación que es 0.51 , nos revela que solo el 51% de la variación de Y es explicado por X. Lo cual no es suficiente para establecer un modelo de predicción que nos asegure la certeza o acercamiento de la predicción de los datos en el futuro.
Respecto al análisis de varianza , el estadístico f es 24.22 cuya probabilidad p es menor que el nivel de significancia alpha =0.05. Lo que implica que realizando una prueba de hipótesis referente a R2 se concluye que el coeficiente de determinación es diferente de cero.
Finalmente tenemos la ecuación del modelo de regresión es Y = -2.89 + 1.08 X
Quiere decir que por cada punto que aumenta el indice de consumo de cigarrillos aumentará en 1.08 el indice de muertes por cáncer de pulmón.
Para nuestro caso tenemos que decir que el modelo no es lo suficientemente consistente como para predecir todo el comportamiente de la variable Y ( Indice por muertes de cáncer de pulmón) sin embargo se acepta que existe una relación lineal ascendente entre las variables analizadas, es decir si aumenta el indice de consumo de cigarrillos es probable que aumente el índice de muertes por cáncer de pulmón.
0 comentarios:
Publicar un comentario