J'ai un fichier météo et j'aimerais vérifier la cohérence entre les valeurs INSEE et le NOM des station météo.
Par exemple : lorsque je fais
Code : Tout sélectionner
length(unique(MeteoArdeche$INSEE))
Code : Tout sélectionner
length(unique(MeteoArdeche$NOM))
J'ai respectivement 59 et 66 (en gros je veux vérifier à quelles codes INSEE il y a plusieurs noms, et quels noms)
Pour vérifier j'ai fait ce code
Code : Tout sélectionner
library(dplyr)
verifcometeoA <- MeteoArdeche %>%
group_by(INSEE) %>%
summarise(
N_distinct = n_distinct(NOM),
NOM = list(unique(NOM))
) %>% as.data.frame
Puis :
Code : Tout sélectionner
(verifcometeoA2 <- verifcometeoA[verifcometeoA$N_distinct == 2, ])
Pour vérifier quelles codes INSEE ont 2 noms.
Cela fonctionnait, mais plus maintenant ! Avant j'avais une colonne [INSEE], [N_distinct] et [NOM]. Et dans la Variable NOM, j'avais les différents noms de stations séparés par une virgule.
Cependant lorsque je fais le même code maintenant je n'arrive plus à retrouver le résultat, j'ai le message :
Code : Tout sélectionner
[1] N_distinct NOM
<0 lignes> (ou 'row.names' de longueur nulle)
et le
Code : Tout sélectionner
str(verifcometeoA )
Code : Tout sélectionner
data.frame': 1 obs. of 2 variables:
$ N_distinct: int 66
$ NOM :List of 1
..$ : chr "ALBA-LA-ROMAINE(ST-PHILIPPE)" ...
Quelqu'un aurait une idée s'il vous plait ?
Merci !