2017-12-14

Renombrar columnas duplicadas al unir dos tablas con dplyr

Problema

Cuando unimos dos tablas con dplyr, las columnas duplicadas de la primera tabla recibirán por defecto el sufijo .x y las de la segunda tabla el sufijo .y. En el siguiente ejemplo, las columnas mpg.x y mpg.y. ¿Cómo podemos modificar esos sufijos?

library("dplyr") 
left_join(mtcars, mtcars[, c("mpg", 'cyl')], by = c("cyl")) %>% head()
  mpg.x cyl disp  hp drat   wt  qsec vs am gear carb mpg.y
1    21   6  160 110  3.9 2.62 16.46  0  1    4    4  21.0
2    21   6  160 110  3.9 2.62 16.46  0  1    4    4  21.0
3    21   6  160 110  3.9 2.62 16.46  0  1    4    4  21.4
4    21   6  160 110  3.9 2.62 16.46  0  1    4    4  18.1
5    21   6  160 110  3.9 2.62 16.46  0  1    4    4  19.2
6    21   6  160 110  3.9 2.62 16.46  0  1    4    4  17.8

Solución

Empleamos el argumento suffix, suministrando un vector de longitud 2 para las dos tablas unidas. En nuestro ejemplo, nombramos las columnas mpg_original (sufijo _original) y mpg_new (sufijo _new).

left_join(mtcars, mtcars[,c("mpg","cyl")], 
              by = c("cyl"), 
              suffix = c("_original", "_new")) %>% head()
  • Datos
  • mpg_original cyl disp  hp drat   wt  qsec vs am gear carb mpg_new
    1           21   6  160 110  3.9 2.62 16.46  0  1    4    4    21.0
    2           21   6  160 110  3.9 2.62 16.46  0  1    4    4    21.0
    3           21   6  160 110  3.9 2.62 16.46  0  1    4    4    21.4
    4           21   6  160 110  3.9 2.62 16.46  0  1    4    4    18.1
    5           21   6  160 110  3.9 2.62 16.46  0  1    4    4    19.2
    6           21   6  160 110  3.9 2.62 16.46  0  1    4    4    17.8
    

    Referencias

    No hay comentarios:

    Publicar un comentario

    Nube de datos