L’objectif est de passer en revue les différentes fonctions de la la librairie dplyr

library(dplyr)

permettant par exemple de

Ces différentes opérations sont appliquées sur le jeu de données flights de la librairie nycflights13

library(nycflights13)
flights

Le jeu de données flights est un tibble une variante de data frame optimisé pour l’usage des fonction de tidyverse.

library(tibble)

Nous allons nous focaliser sur les cinq fonctions clés de la librairie dplyr, à savoir

Ces fonctions s’utilisent en parallèle de la fonction group_by() permettant le traitement par groupe d’observations. Elles prennent toujours comme premier argument le data frame sur lequel on travaille.

Sélectionner des observations avec filter()

# Sélection des vols du 1er Janvier. 
filter(flights, month == 1 & day == 1)
# Sélection des vols de novembre et de décembre
filter(flights, month == 11 | month == 12)
# Autre alternative avec l'opérateur %in%
filter(flights, month %in% c(11, 12))