2014-11-18

Regresión lineal simple para principiantes en Excel

Title La regresión lineal simple sirve para evaluar la relación entre dos variables, una variable independiente X o predictora y una variable dependiente o explicada Y. Se trata de encontrar una ecuación lineal con fines predictivos.

Datos

Como ejemplo, usamos los datos del peso corporal y del corazón de una muestra gatos machos y hembras del paquete MASS en R. Importamos o copiamos los datos en Excel. Tendremos 4 columnas con 144 observaciones. Fichero cats.csv

Obs - número de observaciones
Sex - sexo
Bwt - Body Weight, peso corporal
Hwt - Heart Weight, peso del corazón

Diagrama de dispersión

1. Seleccionamos las columnas Bwt y Hwt.
2. En la ficha Insertar, en el grupo Gráficos, hacemos clic en Dispersión.

Recta de regresión y R²

3. Botón secundario sobre los puntos del gráfico y seleccionamos Agregar línea de tendencia.

4. En Opciones de línea de tendencia, por defecto aparece marcado el tipo lineal, y en la parte inferior marcamos Presentar ecuación en el gráfico y Presentar el valor R cuadrado en el gráfico.
5. Formateamos el gráfico apropiadamente

Alternativa

1. En la ficha Presentación, en el grupo Análisis, clic en Línea de tendencia.

2. Clic sobre la línea de tendencia y seleccionamos Formato de línea de tendencia y, en la parte inferior, marcamos Presentar ecuación en el gráfico y Presentar el valor R cuadrado en el gráfico.

Aplicación del modelo

Con la ecuación de la recta de regresión podemos calcular el valor de la variable dependiente Y introduciendo un valor de la variable independiente X en la misma: y = mx + b

Definimos los nombres:

Bwt= =Hoja1!$C$2:$C$145
Hwt = =Hoja1!$D$2:$D$145

Calculamos la pendiente y la intersección en Y:

m - pendiente: =PENDIENTE(Hwt;Bwt)
b - intersección Y: =INTERSECCION.EJE(Hwt;Bwt)

Ejemplos:

Si un gato pesa 5 Kg, ¿cuál es el peso estimado de su corazón?: = 5*4,03406-0,35666 = 19,81365
Si un gato pesa 3 Kg, ¿cuál es el peso estimado de su corazón?: = 3*4,03406-0,35666 = 11,74552

Bondad del modelo

R², el coeficiente de determinación, nos informa de la bondad del ajuste del modelo. Se calcula elevando al cuadrado el coeficiente de correlación de Pearson. Varía entre 0 y 1.

    0 - las variables son independientes
    1 - existe una relación perfecta entre las variables
En nuestro ejemplo es 0,6466. Indica que conociendo el peso de un gato mejoramos un 64,66% nuestra estimación del peso del corazón, si usamos nuestro modelo en lugar del peso medio del corazón de un gato.

Referencias

No hay comentarios:

Publicar un comentario

Nube de datos