Suite à un précédent message qui n’a pas trouvé de réponse, j’ai cherché une nouvelle technique pour appréhender mon problème : à savoir, la détection de valeurs aberrantes « ponctuelles » au sein de courbes de croissance (qui seraient dû à des erreurs de saisie). Mon souci à présent se trouve dans le fait de développer un script un peu compliqué à mes yeux.
Mon jeu de données est constitué de nombreuses courbes de croissances (plusieurs milliers). Pour chaque individu, il a été saisi un relevé de son poids chaque jour durant 365 jours.
Mon tableau de données se présente sous la forme suivante, les données d’un individu par ligne et un âge différent par colonne, comme suit :
Code : Tout sélectionner
Age J1 J2 J3 J4 … J365
Ind1 39 42 45.8 54 1488
Ind2 46 51 57 66 2532
Ind3 32 33 35 40 1325
… Indx 27 28 30 33 1263
Je souhaiterai pouvoir calculer la moyenne entre J et J+2 (sans prendre en compte J+1) pour chaque point de la courbe et ce, pour chaque individu. Puis, j’aurai besoin de détecter si la valeur observée à J+1 se situe à + ou – 20% de la moyenne calculée. Dans l’idéal, le script pourrait me renvoyer la liste des individus pour lesquels il existe une valeur observée dans la courbe dépassant cet écart à la moyenne calculée.
Je vous remercie par avance de votre aide,
Aurélie