2015-11-23

Diagramas de dispersión con el paquete car en R

Title

Introducción

La función scatterplot del paquete car nos permite crear diagramas de dispersión mejorados. Incluye diagramas de caja en los márgenes, rectas de regresión suavizadas, identificación de valores atípicos etc. Veremos varios ejemplos usando datos (data frames) incluidos en el propio paquete car: Prestige y UN.

library(car)
head(Prestige)
                     education income women prestige census type
gov.administrators      13.11  12351 11.16     68.8   1113 prof
general.managers        12.26  25879  4.02     69.1   1130 prof
accountants             12.77   9271 15.70     63.4   1171 prof
purchasing.officers     11.42   8865  9.11     56.8   1175 prof
chemists                14.62   8403 11.68     73.5   2111 prof
physicists              15.64  11030  5.13     77.6   2113 prof

Ejemplos

  1. Gráfico relacionando la renta y la educación, incluyendo diagramas de caja en los ejes y regresión local (línea LOESS). Empleamos el formato fórmula y ~ x para indicar las variables a representar.
  2. scatterplot(education ~ income,
                data = Prestige,
                pch = 16,
                col = "darkblue",
                main = "Educación y Renta\n del conjunto de datos \"Prestige\"",
                xlab = "Renta (dollares)",
                ylab = "Educación (años)")
    
  3. Añadiendo elipses donde se concentran los datos
  4. scatterplot(prestige ~ income, data = Prestige, ellipse = TRUE)
    

  5. Representamos grupos siguiendo el formato y ~ x | z, en el que z evalúa como un factor otra variable pare dividir los datos en grupos.
  6. scatterplot(prestige ~ income|type, data = Prestige, legend.coords = "topleft")

  7. Etiquetar un número determinado de puntos.

  8. Por defecto id.n = 0, lo especificamos para indicar el número de puntos que deseamos etiquetar.
    scatterplot(infant.mortality ~ gdp, log = "xy", data = UN, id.n = 5)

  9. Etiquetar los datos interactivamente.

  10. Utilizamos el argumento id.method para etiquetar de la misma manera que hicimos con la función identify.

    scatterplot(infant.mortality ~ gdp, id.method = "identify", data = UN)

Entradas relacionadas

Referencias

No hay comentarios:

Publicar un comentario

Nube de datos