Je souhaiterai pouvoir calculer automatiquement le nombre de valeurs uniques se trouvant dans une colonne en fonction de l'année dans ma base de données.
C'est une base de données dans laquelle chaque dossier à un identifiant unique ("Ref_Dossier") mais peut se retrouver sur plusieurs lignes en fonction des critères qu'il remplit. Un simple calcul par ligne ne suffit donc pas.
Actuellement, je sépare ma base de données en plusieurs sous tableaux par an puis je compte le nombre de valeurs uniques. Voici un extrait de mon code :
Code : Tout sélectionner
An17<-subset(Data,Data$Date>"2017-01-01" & Data$Date<"2017-12-31") #An17 = sous tableau contenant uniquement les lignes de 2017 issues de Data
nb17<-length(unique(An17$`Ref_Dossier`)) ; nb17 #nb17 : nombre de valeurs uniques en 2017
An18<-subset(Data,Data$Date>"2018-01-01" & Data$Date<"2018-12-31")
nb18<-length(unique(An18$`Ref_Dossier`)) ; nb18
An <- data.frame(c(nb17,nb18) #tableau final regroupant les nombres de valeurs uniques par an
colnames(An) <- "Nombre de dossiers"
rownames(An)<-c("2017","2018")
Le problème est que cela crée beaucoup de sous tableaux, d'autant plus que je répète ce genre de calculs pour plusieurs modalités (autre que l'analyse annuelle).
Je ne sais pas vraiment comment m'y prendre autrement car je ne maitrise pas très bien les fonctions et les conditions.
Je vous remercie d'avance pour votre aide.