Introducción
La función scatterplot del paquete car nos permite crear diagramas de dispersión mejorados. Incluye diagramas de caja en los márgenes, rectas de regresión suavizadas, identificación de valores atípicos etc. Veremos varios ejemplos usando datos (data frames) incluidos en el propio paquete car: Prestige y UN.
library(car)
head(Prestige)
education income women prestige census type
gov.administrators 13.11 12351 11.16 68.8 1113 prof
general.managers 12.26 25879 4.02 69.1 1130 prof
accountants 12.77 9271 15.70 63.4 1171 prof
purchasing.officers 11.42 8865 9.11 56.8 1175 prof
chemists 14.62 8403 11.68 73.5 2111 prof
physicists 15.64 11030 5.13 77.6 2113 prof
Ejemplos
- Gráfico relacionando la renta y la educación, incluyendo diagramas de caja en los ejes y regresión local (línea LOESS). Empleamos el formato fórmula y ~ x para indicar las variables a representar.
- Añadiendo elipses donde se concentran los datos
- Representamos grupos siguiendo el formato y ~ x | z, en el que z evalúa como un factor otra variable pare dividir los datos en grupos.
- Etiquetar un número determinado de puntos.
- Etiquetar los datos interactivamente.
scatterplot(education ~ income,
data = Prestige,
pch = 16,
col = "darkblue",
main = "Educación y Renta\n del conjunto de datos \"Prestige\"",
xlab = "Renta (dollares)",
ylab = "Educación (años)")
scatterplot(prestige ~ income, data = Prestige, ellipse = TRUE)
scatterplot(prestige ~ income|type, data = Prestige, legend.coords = "topleft")
Por defecto id.n = 0, lo especificamos para indicar el número de puntos que deseamos etiquetar.
scatterplot(infant.mortality ~ gdp, log = "xy", data = UN, id.n = 5)
Utilizamos el argumento id.method para etiquetar de la misma manera que hicimos con la función identify.
scatterplot(infant.mortality ~ gdp, id.method = "identify", data = UN)
Entradas relacionadas
Referencias
No hay comentarios:
Publicar un comentario