J'ai un dataframe de la forme suivante (les NA correspondent à des 0) :
Code : Tout sélectionner
date_TU ID_pluie Pluvio Debit_A Debit_B Debit_C Debit_D
2017-01-10 02:54:00 1 0.2 NA 0.6 78.4 1204.5
2017-01-10 02:56:00 1 0.4 25.6 0.6 48.6 1356.7
2017-01-10 02:58:00 1 0.4 37.8 NA 78.7 702.7
2017-01-10 03:00:00 1 NA 157.8 NA NA 958.1
2017-01-10 03:02:00 1 NA 0.6 NA NA 1204.5
...
2018-09-10 14:05:00 5 0.2 NA 3.6 45.3 NA
2018-09-10 14:05:00 5 0.4 5.5 5.6 78.3 2.4
2018-09-10 14:05:00 5 0.2 NA 0.5 45.3 NA
…
2019-12-27 00:32:00 265 0.4 NA 0.6 178.5 4.5
2019-12-27 00:34:00 265 0.4 NA 2.3 NA 12.5
2019-12-27 00:36:00 265 0.2 NA 5.3 NA 14.4
2019-12-27 00:38:00 265 NA NA 15.6 NA NA
2019-12-27 00:40:00 265 NA NA 12.3 NA NA
2019-12-27 00:42:00 265 NA NA 9.6 NA NA
2019-12-27 00:44:00 265 NA NA 3.1 NA NA
2019-12-27 00:46:00 265 NA NA 1.8 NA NA
2019-12-27 00:48:00 265 NA NA 0.6 NA NA
2019-12-27 00:50:00 265 NA NA NA NA NA
...
2019-12-30 13:28:00 266 NA 127.9 38.5 NA NA
2019-12-30 13:30:00 266 NA 127.9 38.5 NA NA
La colonne ID_pluie correspond à un identifiant unique pour chaque événement pluvieux.
Je cherche ici à créer un dataframe pour chaque ID_pluie (soit chaque événement).
Si le début de ces événements est clairement défini il faut que je définisse leur fin selon les conditions suivantes :
- Fin de Evènement quand les colonnes Débits A, B, C et D (en L/h) sont toutes inférieurs à 1.8 L/h en une heure.
- Ou Fin de Evènement quand un nouvel événement commence (si la condition précédente n’est jamais atteinte)
Afin de pouvoir appliquer la première condition peut être faut il que je crée une nouvelle colonne qui ferait la somme des débit sur 1h pour chaque pas de temps? mais ensuite comment dire à R de "couper" l’événement une fois la conditions atteinte ? (soit que les débits A, B, C et D soit tous inférieur à 1.8 L/h sur 60mn)
Enfin est-il possible de créer un dataframe pour chaque événement (soit presque 200-300 df) ? si oui est il possible ensuite de travailler sur tous ces df en même temps ? Je m'explique : si je veux créer par exemple une colonne "somme", puis-je le faire pour tous les événements en même temps ? ou est ce que je dois d'abord créer cette colonne avant de séparer tous les événements dans des df différents ?
Je suis conscient que ce que je demande n’est pas simple (en tous cas ça n'a pas l'air) mais c’est pour ça que je m’en remets à vous. Si vous avez des pistes, des packages, des suggestions ou d’autres éléments qui pourrait m’être utile je suis preneur.
Si vous désirez d'avantage d'informations ou explication sur les données n'hésitez pas.
Merci d’avance pour votre aide,
Bonne semaine,
Théo Boudard