2016-12-31

Muestra aleatoria de un data frame basada en una condición en R

Title

Problema

Deseamos extraer una muestra aleatoria de filas de un data frame basada en una condición en R. En nuestro ejemplo una muestra aleatoria del data frame iris que no contenga filas de la especie Setosa.

Solución

  • Paquete base
  • set.seed(12)
    iris[sample(which(iris$Species != "setosa"), 2), ]
    
       Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
    57           6.3         3.3          4.7         1.6 versicolor
    131          7.4         2.8          6.1         1.9  virginica
    
  • Paquete dplyr
  • library(dplyr)
    set.seed(12)
    filter(iris, Species != "setosa") %>% sample_n(., 2) 
    
       Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
    7           6.3         3.3          4.7         1.6 versicolor
    81          7.4         2.8          6.1         1.9  virginica
    

    Entradas relacionadas

    Referencias

    No hay comentarios:

    Publicar un comentario

    Nube de datos