L’objectif est de passer en revue les différentes fonctions de la la librairie dplyr
library(dplyr)
permettant par exemple de
Ces différentes opérations sont appliquées sur le jeu de données flights de la librairie nycflights13
library(nycflights13)
flights
Le jeu de données flights est un tibble une variante de data frame optimisé pour l’usage des fonction de tidyverse.
library(tibble)
Nous allons nous focaliser sur les cinq fonctions clés de la librairie dplyr, à savoir
Ces fonctions s’utilisent en parallèle de la fonction group_by() permettant le traitement par groupe d’observations. Elles prennent toujours comme premier argument le data frame sur lequel on travaille.
# Sélection des vols du 1er Janvier.
filter(flights, month == 1 & day == 1)
# Sélection des vols de novembre et de décembre
filter(flights, month == 11 | month == 12)
# Autre alternative avec l'opérateur %in%
filter(flights, month %in% c(11, 12))