Gráfico a replicar
Continuamos con la serie iniciada sobre la creación de gráficos del libro An Introduction to Statistical Learning. En esta ocasión replicaremos los gráficos de la figura 2.1. Utilizan el conjunto de datos Advertising. El gráfico representa las ventas en unidades de mil como una función de los presupuestos de televisión, radio o prensa, para 200 mercados. En cada gráfico se muestra la recta de regresión lineal que mejor se ajusta para las ventas y cada variable, descrito en el capítulo 3 del libro. En otras palabras, cada línea azul representa un modelo simple que puede ser usado para predecir las ventas usando la televisión, radio o prensa respectivamente.
Solución
library(tidyr)
library(ggplot2)
ad <- read.csv("http://www-bcf.usc.edu/~gareth/ISL/Advertising.csv")
ad_long <- gather(ad, media, budgets, TV:newspaper, factor_key = TRUE)
ggplot(ad_long, aes(x = budgets, y = sales, colour = media)) +
geom_point()
ggplot(ad_long, aes(x = budgets, y = sales)) +
geom_point() +
facet_grid( ~ media, scales = "free") +
geom_smooth(method = "lm")
Entradas relacionadas
- Gráficos de An Introduction to Statistical Learning con ggplot2 - Figura 1.1
- Gráficos de An Introduction to Statistical Learning con ggplot2 - Figura 1.2
- Gráficos de An Introduction to Statistical Learning con ggplot2 - Figura 1.3
- Gráficos de An Introduction to Statistical Learning con ggplot2 - Figura 1.4
- Gráficos de An Introduction to Statistical Learning con ggplot2 y plotly - Figura 1.4 interactiva
- Entradas de diagramas de dispersión
- Subconjunto de estadísticas descriptivas en R
No hay comentarios:
Publicar un comentario