Je dispose d'un dataframe qui présente le nombre de nouveaux équipements par type construit depuis 1975 à 2020. Je souhaite créer une nouvelle colonne qui indique, pour chaque année et type d'équipement, le taux d'évolution des constructions. L'objectif étant de réaliser un geom_line pour montrer l'évolution des différents types d'équipements, année après année.
Voici un dataframe reproductible, similaire à celui sur lequel je travaille.
Code : Tout sélectionner
library(truncnorm)
library(lubridate)
library(tidyverse)
#Générer des colonnes numériques et catégorielles
data = data.frame(annee = as.integer(rtruncnorm(1000, a = 1975, b = 2020, mean = 2000, sd = 1000)), type_equipement = sample(c("Equipement1", "Equipement2", "Equipement3", "Equipement4", "Equipement5"), 1000, replace = TRUE), nombre_creation = as.integer(rtruncnorm(1000, a = 0, b = 10, mean = 3, sd = 1.5)))
#Convertir la colonne annee en variable de type "year"
data$annee = year(ymd(data$annee, truncated = 2L))
#Grouper par annee et type_equipement
data = data %>% group_by(annee, type_equipement) %>% summarise(nInAnnee = sum(nombre_creation)) %>% arrange(annee, type_equipement)
Est-il possible de faire ça sur R ?
Merci.