2017-04-22

Controlar la transparencia con geom_rect en ggplot2

Title

Problema

Si tratamos de crear un rectángulo semitransparente (argumento alpha) en ggplot mediante geom_rect obtenemos un rectángulo opaco.

  • Datos originales
  • df1 <- structure(list(date = structure(c(1335744000, 1380499200, 1464652800, 1356912000, 
        1485820800, 1490918400, 1383177600, 1461888000, 1454025600, 1367280000, 1343692800, 
        1401408000, 1330473600, 1391126400, 1459382400, 1404086400, 1417132800, 1477872000, 
        1469750400, 1443571200, 1419984000, 1438300800, 1346371200, 1369958400, 1483056000, 
        1440979200, 1424995200, 1377820800, 1388448000, 1375228800, 1480464000, 1359590400, 
        1354233600, 1412035200, 1427760000, 1385683200, 1467244800, 1472601600, 1372377600, 
        1475193600, 1333065600, 1435622400, 1409270400, 1396224000, 1488240000, 1364515200, 
        1340928000, 1406764800, 1456704000, 1430352000, 1338422400, 1348790400, 1351641600, 
        1432857600, 1327968000, 1448841600, 1398816000, 1446163200, 1362009600, 1422576000, 
        1451520000, 1414713600, 1393545600), class = c("POSIXct", "POSIXt")), pb = c(3.24284787690623, 
        2.35203304295562, 1.13562266384702, 2.90837861538151, 1.97393507382208, 1.79790256367522, 
        2.50992970378761, 1.2966057820916, 0.892051550643623, 2.56310397446516, 2.53722570614735, 
        2.42427665519818, 3.40294643294178, 2.2456624603825, 1.06554620628802, 2.12883927956712, 
        1.65800890792078, 1.71460655379306, 1.45450176074979, 1.28199154762022, 1.51004082825039, 
        1.59579220438853, 2.48072865275449, 2.52511938910325, 1.77197981412129, 1.4666225767599, 
        1.65482654263216, 2.24097337718875, 2.39207143276774, 2.18796717170196, 1.78667497794161, 
        2.95189774752025, 2.70906851093917, 1.8620615761957, 1.48932926967017, 2.40482981571083, 
        1.3614263004647, 1.5052848414737, 2.02094466655017, 1.67901881433697, 3.13131652724628, 
        1.7081053507639, 2.15479184551088, 2.37902994058881, 1.88440485774789, 2.57891658188723, 
        2.43424745762712, 2.25929464919641, 0.913664833729333, 1.58426153545149, 2.71711735504797, 
        2.59023788287105, 2.68172936708349, 1.5228439100185, 3.47144812971019, 1.07692509768545, 
        2.46172899067256, 1.34932598268774, 2.86559619320822, 1.43158577260698, 1.06755701001995, 
        1.87542832179586, 2.41716851824514), return_index = c(3.33963134143023, 3.53315257934844, 
        2.24983743575813, 3.54713517594007, 3.17031433226149, 2.92415007661754, 3.72288287285945, 
        2.43858382371356, 1.78853472205546, 3.17524563672478, 2.99957813429811, 3.72169243241355, 
        3.39125767791388, 3.614770311344, 1.98808399128776, 3.61004165944114, 3.16597358572951, 
        2.74562414401218, 2.30169956340851, 2.58899122167033, 3.00735830908446, 2.97573979012093, 
        2.9863799905072, 3.38703452069432, 2.98242176129961, 2.83290428019513, 3.44566574584198, 
        3.47136232987663, 3.75521536603366, 3.36372318786495, 2.90514490677928, 3.58331595473466, 
        3.28803779749728, 3.46781820411579, 3.2620117615886, 3.69607811617486, 2.19921609345358, 
        2.40895876306335, 3.04629884791247, 2.66358570431915, 3.25119873581604, 3.04330107396291, 
        3.68720702192003, 3.66737118374507, 2.97502296939418, 3.18097138521817, 2.95437617876303, 
        3.88945888388189, 1.81411076858085, 3.36085071796473, 3.00333046534821, 3.15899275395851, 
        3.27461188875339, 3.32892263614407, 3.47144812971019, 2.10766875686013, 3.79609591229452, 
        2.68219490565046, 3.54425781082805, 2.99623108334085, 2.08090136364801, 3.4771813132669, 
        3.79370144175553)), class = c("tbl_df", "tbl", "data.frame"), row.names = c(NA, -63L), 
        .Names = c("date", "pb", "return_index"))
    

  • Código original
  • library(ggplot2)
    min_date = min(df1$date) # data frame creado más abajo
    max_date = max(df1$date)
    ggplot(df1) +
        geom_rect(aes(xmin = min_date, xmax = max_date, ymin = -Inf, ymax = 3), fill = "palegreen", alpha = 0.2) +
        geom_line(aes(x = date, y = pb, colour = "P/B")) +
        geom_line(aes(x = date, y = return_index, colour = "return"))
    

Solución

La función geom_rect dibuja rectángulos, uno por cada una de las filas, superpuestos uno encima del otro, de manera que el resultado final es un rectángulo opaco. Para resolverlo tenemos 2 alternativas:

  1. Alternativa 1: Usar annotate en lugar de geom_rect.
  2. ggplot(df1) +
      annotate("rect", xmin = min_date, xmax = max_date, ymin = -Inf, ymax = 3, fill = "palegreen", alpha = 0.2) +
      geom_line(aes(x = date, y = pb, colour = "P/B")) +
      geom_line(aes(x = date, y = return_index, colour = "return"))
    
  3. Alternativa 2: Eliminar el argumento data = df1 de la función ggplot y añadirlo en las capas que lo necesiten.
  4. ggplot() +
      geom_rect(aes(xmin = min_date, xmax = max_date, ymin = -Inf, ymax = 3), fill = "palegreen", alpha = 0.2) +
      geom_line(data= df1, aes(x = date, y = pb, colour = "P/B")) +
      geom_line(data= df1, aes(x = date, y = return_index, colour = "return"))
    

Resultado

Entradas relacionadas

2017-04-16

Control de versiones con RStudio, Git y GitHub

Title

Introducción

Control de versiones es un sistema que nos permite llevar un registro de los cambios en nuestro código y compartir los mismos con otros. Es una herramienta muy valiosa tanto para para trabajar en equipo como para trabajar individualmente, manteniendo nuestro código actualizado y accesible desde cualquier ordenador.

¿Por qué usar control de versiones, Git y GitHub?

  • Permite trabajar simultáneamente con el mismo fichero, evitando sobreescribir cambios, guardando un registro de los mismos, y combinándolos automáticamente, mostrando los conflictos entre las diferentes versiones.
  • Evitar errores y pérdidas accidentales ya que permite revisar el historial de cambios y restaurar versiones anteriores.
  • Facilita compartir nuestro código y acceder al mismo desde cualquier ordenador, sin necesidad de emails o de sistemas de almacenamientos de archivos no pensados para la edición de código.
  • Git y GitHub son dos de las herramientas más populares de control versiones. Esto facilita poder encontrar más fácilmente soluciones en StackOverflow u otros foros a los problemas que puedan surgirnos. RStudio también permite con otro sistema de control de versiones: Subversion.

Inconvenientes

  • La curva de aprendidaje es empinada y puede ser frustrante al principio.
  • Aprender la terminología y sintáxis.
Por suerte, ser capaz de configurar un control de versiones con RStudio y aprovecharnos de las funcionalidades más básicas es muy sencillo.

Configuración

  1. Instala Git
  2. Configuramos Git. Abrimos Git Bash o Git CMD e indicamos nuestro nombre y cuenta de correo electrónico:
  3. git config --global user.name "Nombre"
    git config --global user.email "Dirección de correo electrónico"
    # Para comprobar la configuración
    git config --global --list 
    
  4. Configuramos RStudio. Clic en Tools. En la sección Git/SVN marcamos la opción de Enable version control interface for RStudio projects. En Git executable indicamos la ruta del ejecutable, en el caso de que tras instalar Git y reiniciar RStudio no aparezca.
  5. Abrimos una cuenta gratuita en GitHub
  6. Creamos un repositorio en GitHub.

Clonar un repositorio de GitHub

Crearemos una copia de un repositorio de GitHub en nuestro ordenador.

  1. Clic en File y en New Project, Version Control y Git.
  2. Rellenamos los siguientes 3 campos:
    • Repository URL: la dirección en GitHub del repositorio a clonar.
    • Project directory name: por defecto tomará el nombre del repositorio en GitHub.
    • Create project as subdirectory of: creará por defecto una carpeta con el nombre del proyecto en el directorio de trabajo.
  3. Clic en Create Project

Gestión básica de un proyecto

Una vez creado un proyecto, podemos copiar o guardar scripts en la carpeta creada anteriormente (por defecto una carpeta dentro del directorio de trabajo actual).

Hay 3 secciones dentro de RStudio

  1. El panel git, en la esquina superior derecha, muesta los ficheros cambiados e incluye los botones más importantes de los comandos de Git.
  2. El menú desplegable git, disponible en la barra de herramientas, con los comandos Git, GitHub y otra serie de acciones aplicables al fichero actual:
  3. Panel con los ficheros y subcarpetas dentro del proyecto.

Revisar cambios

En el panel de Git podemos examinar los cambios realizados. Los iconos indican si los ficheros han sido:

  • Modificados - Se ha cambiado su contenido.
  • Sin seguimiento (Untracked) - Ficheros añadidos detectados por Git.
  • Borrados (Deleted) - Ficheros borrados.
Para conocer más detalles de los cambios de un fichero, clic en Diff en el panel Git o en el menú desplegable Git en la barra de herramientas. Después clic en el fichero deseado.

En el menú emergente los colores nos ayudan a localizar el texto añadido en verde, el texto eliminado, en rojo y en blanco sin cambios. Las columnas de números señalan la ubicación del código: a la izquierda en la antigua versión, y a la derecha en la nueva.

Guardar cambios

Para guardar los cambios utilizamos Commit que confirma los cambios realizados.
  1. Guardamos el documento actual en RStudio: clic en Save o bien Ctrl + S.
  2. Abrimos el menú emergente, el mismo de la sección anterior: clic en Commit o Ctrl + Alt + M
  3. Seleccionamos los archivos deseados, Ctrl + A para seleccionar todos, y marcamos la casilla de verificación Staged. Cambiará el icono en la columna Status.
  4. Escribimos un mensaje en la sección Commit message, describiendo los cambios realizados. Es obligatorio.
  5. Clic en el botón Commit.

Sincronizar los cambios con GitHub

Hasta ahora hemos trabajado localmente en nuestro ordenador. Para subir los cambios a GitHub: presionamos Push en el panel Git. Nos informará de si el cambio fue realizado con éxito, o del motivo del error.

Si por el contrario, hemos hecho cambios desde otro ordenador y queremos cerciorarnos de que tenemos la última copia guardada en GitHub en presionaremos Pull.

Entradas relacionadas

Referencias

2017-03-31

Buscar cadena de texto en todos los ficheros de una carpeta con RStudio

Title

Problema

Necesitamos identificar una cadena de texto en algunos de nuestros R scripts. Por ejemplo: un paquete, función o nombre de in objeto. Con Find dentro del menú Edit solamente podemos encontrar las ocurrencias dentro del R script activo.

Solución

  1. Utilizamos la opción Find in Files dentro de menú Edit: Ctrl + Mayús + F.
  2. En el menú emergente tecleamos la cadena de búsqueda (ggplot en nuestro ejemplo) y podemos seleccionar:

    - Que distinga entre mayúculas y minúsculas.
    - Usar expresiones regulares (regular expressions o regex).
    - La carpeta de búsqueda.
    - Tipo de fichero de búsqueda: todos los ficheros, R source files, R Scripts o tipo de fichero personalizado.

  3. Presionamos Find
  4. En los resultados de búsqueda encontraremos
  5. - En negrita la ruta del fichero.
    - El número de línea donde se encuentra la cadena de búsqueda.
    - Resaltada dentro de la línea la cadena de búsqueda.

  6. Doble clic en cualquiera de las líneas abrirá el fichero correspondiente, y situará el cursor al comienzo de la línea seleccionada.

Entradas relacionadas

2017-03-25

Listar ficheros de una carpeta en Excel

Title

Problema

Queremos listar los ficheros de una carpeta en Excel.

Solución

Empleamos un truco de John Walkenbach que leí hace bastante tiempo.

  1. Copiamos la ruta del explorador de Windows.
  2. La pegamos en la barra de direcciones de nuestro navegador y presionamos la tecla Entrar.
  3. Obtendremos el siguiente resultado (identificador de recursos uniforme.)
  4. Seleccionamos todo presionando Ctrl+A
  5. Abrimos un Excel y pegamos el resultado anterior presionando Ctrl+V. Si lo deseamos pegar como valores, presionamos Ctrl+Alt+V y seleccionamos Texto.
  6. Los hipervínculos funcionan cuando los pego desde Firefox pero no desde Chrome (precede las rutas duplicando el nombre de la unidad C:\C:\). Pero es algo que quizá cambie en función de la versión del navegador.

Entradas relacionadas

2017-03-17

Guardar un fichero Excel como un fichero CSV Unicode (UTF-8)


Title

Problema

Deseamos guardar un fichero Excel como un CSV codificado como UTF-8. De esta manera podremos representar cualquier caracter Unicode.

Solución

  1. Archivo, Guardar como o presionamos F12.
  2. Clic en Herramientas y en Opciones web.
  3. En Guardar este documento como, seleccionamos Unicode (UTF-8)
  4. En Tipo seleccionamos CSV (delimitado por comas).
  5. Clic en Aceptar y en Guardar tras seleccionar la ruta deseada.

Entradas relacionadas

2017-03-13

Convertir números a nombres de meses con Excel


Title

Problema

Queremos convertir los números a nombres de meses en Excel. Es decir, si hay un 1 queremos convertirlo a enero, o si hay un 12 a diciembre.

Solución

Empleamos la siguiente fórmula y arrastramos la fòrmula hacia abajo.

  • Abreviatura del mes
  • =TEXTO(FECHA(2017;B3;1);"mmm")

  • Nombre completo del mes
  • =TEXTO(FECHA(2017;B3;1);"mmmm")

Resultado

En la imagen aparece la versión de los meses en inglés, debido a la configuración de mi ordenador.

2017-03-06

Calcular la fecha de la Semana Santa en Excel


Title

Problema

Queremos calcular la fecha de la Semana Santa, en concreto, el Domingo de Resurrección en Excel.

Solución

Empleamos la siguiente fórmula de Norbert Hetterich, vinculada a la celda A2 en la que indicaremos el año deseado. La fórmula arroja solamente resultados válidos entre los años 1900 y 2078.

=MULTIPLO.INFERIOR.MAT(DIA(MINUTO(A2/38)/2+56)&"/5/"&A2,7)-34

Resultado

Referencias

2017-02-28

Cómo cambiar el ancho de las barras de error de un diagrama de caja con ggplot2

Title

Problema

Deseamos modificar el ancho de las líneas de las barras de error en un diagrama de caja creado con ggplot2. Con stat_boxplot(geom ='errorbar') añadimos las barras de error.

library(ggplot2)
ggplot(iris, aes(factor(Species), Sepal.Width, fill = Species)) +
    geom_boxplot() + 
    stat_boxplot(geom ='errorbar')

Solución

Utilizamos el argumento width dentro de stat_boxplot.

library(ggplot2)
ggplot(iris, aes(factor(Species), Sepal.Width, fill = Species)) +
  geom_boxplot() + 
  stat_boxplot(geom ='errorbar', width = 0.5) 

Entradas relacionadas

2017-02-27

Cómo añadir barras de error a un diagrama de caja con ggplot2

Title

Problema

Deseamos añadir barras de error a un diagrama de caja creado con ggplot2, como aparecen por defecto con el paquete base. De manera que tendremos dos líneas perpendiculares en los extremos de los bigotes de la caja.

library(ggplot2)
ggplot(iris, aes(factor(Species), Sepal.Width, fill = Species)) +
    geom_boxplot() 

Solución

Con stat_boxplot(geom ='errorbar') añadimos las barras de error.

ggplot(iris, aes(factor(Species), Sepal.Width, fill = Species)) +
  stat_boxplot(geom ='errorbar')+
  geom_boxplot() 
Es importante recordar que el orden de cada capa altera el resultado final. Si escribimos primero geom_boxplot la línea sólida vertical se dibuja encima de la caja.

ggplot(iris, aes(factor(Species), Sepal.Width, fill = Species)) +
    geom_boxplot() + 
    stat_boxplot(geom ='errorbar')

Entradas relacionadas

Nube de datos