Je cherche à réaliser une opération sûrement très simple mais j'ai essayé plusieurs fonctions sans succès et je ne trouve la réponse nul part (peut être n'utilise-je pas les bons termes).
Je dispose d'un tableau de données compilant des piégeages d'insectes avec la structure suivante :
Code : Tout sélectionner
> summary(data)
Bloc Trap Rep Session Date_in
Bloc1:108 Biobest :108 Min. :1 Session1:108 03/10/2022:108
Bloc2:108 Droframb:108 1st Qu.:1 Session2:108 07/10/2022:108
Bloc3:108 HomeMade:108 Median :2 Session3:108 12/10/2022:108
Mean :2
3rd Qu.:3
Max. :3
Date_out Sp Nb X
07/10/2022:108 Dother:81 Min. : 0.00 :320
12/10/2022:108 Dsuz_f:81 1st Qu.: 4.00 Piege plein: 4
17/10/2022:108 Dsuz_m:81 Median : 11.00
Other :81 Mean : 26.15
3rd Qu.: 30.00
Max. :528.00
Code : Tout sélectionner
> head(data)
Bloc Trap Rep Session Date_in Date_out Sp Nb X
1 Bloc1 HomeMade 1 Session1 03/10/2022 07/10/2022 Dsuz_f 42
2 Bloc1 HomeMade 1 Session1 03/10/2022 07/10/2022 Dsuz_m 23
3 Bloc1 HomeMade 1 Session1 03/10/2022 07/10/2022 Dother 12
4 Bloc1 HomeMade 1 Session1 03/10/2022 07/10/2022 Other 4
5 Bloc1 HomeMade 2 Session1 03/10/2022 07/10/2022 Dsuz_f 25
6 Bloc1 HomeMade 2 Session1 03/10/2022 07/10/2022 Dsuz_m 18
Par exemple, ici les 4 premières lignes correspondent à 4 espèces/groupe d'espèces (colonne Sp) d'un même échantillon (identifié par les colonnes Bloc, Trap, Rep, Session, Date_in, Date_out).
Je cherche pour chaque échantillon à regrouper les modalités Dsuz_f et Dsuz_m de "Sp" en une modalité Dsuz qui comporterait dans la colonne "Nb" la somme des 2 valeurs initiales (ici 65 pour Rep 1, puis 43 pour Rep 2).
Auriez vous une solution?
Merci d'avance pour votre aide !