Bonjour,
Je suis nouvelle sur le forum et dispose d'un jeu de données (dataframe à 3 colonnes) où chaque ligne représente un site (site = colonne 1) prospecté à différentes dates (date = colonne 2) sur lequel on a réalisé un comptage (nb = colonne 3). On dispose de 10 dates et de 4000 sites. Ces derniers sont parfois comptés 10 fois et d'autres moins (présence de NA).
J'aimerais tirer aléatoirement un échantillon des comptages de tous mes sites pour 2 dates, afin de réaliser ensuite une moyenne par site des comptages sur cet échantillon en tenant compte des NA.
J'ai testé plusieurs options:
- via un split mais la création d'une liste de df me bloque pour réaliser les moyennes par ligne avec les fonctions apply.
- via les fonctions subset puis aggregate, mais je n'arrive pas à intégrer un critère aléatoire qui pourrait ressembler à quelque chose du genre subset(monDF, date==sample(monDF$date,2))
Cela me semble tout simple mais j'échoue, vous trouverez surement une solution!
Bonne journée