comment signaler les variable manquantes

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Betty Kuzondisa
Messages : 14
Enregistré le : 27 Juin 2018, 14:26

comment signaler les variable manquantes

Messagepar Betty Kuzondisa » 06 Juil 2018, 12:31

Bonjour,
je veux estimer la moyenne d'une de mes variables aide familiale, variable quantitative, mais dans certaines case de ma variable; quand j'avais pas d'information sur les heures précises, je codais 999.0.
Du coup, maintenant j'essaie d'avoir la moyenne de ma variable aide. familiale mais elle est biaisée parce qu' elle tient aussi compte de case que j'ai codé 999.0
Quel code je devrai taper pour demander la moyenne de ma variable en signalant à R de ne pas inclure les cases coder 999.O?

Svp, aidez- moi.
Merci beaucoup.

Eric Casellas
Messages : 767
Enregistré le : 06 Jan 2009, 14:59

Re: comment signaler les variable manquantes

Messagepar Eric Casellas » 06 Juil 2018, 12:50

Bonjour,

D'une part il y a la fonction is.na qui permet de dire à R quelles sont les valeurs à traiter comme manquantes.
D'autre part certaines fonction (comme mean par exemple), peuvent avoir un paramètre na.rm permettant de dire si on veux exclure ou pas les valeurs manquantes...

A priori en combinant les deux tu devrais pouvoir faire ce que tu veux.

Eric
Eric

Serge Rapenne
Messages : 1426
Enregistré le : 20 Aoû 2007, 15:17
Contact :

Re: comment signaler les variable manquantes

Messagepar Serge Rapenne » 06 Juil 2018, 13:07

Bonjour,

plusieurs possibilités, en voici 2 :
Tu remplaces le 999 par NA dans le df par ex comme ça :

Code : Tout sélectionner

#creation d'un jeu de données bidon pour l'ex
dta<-data.frame(A=c(999,1:3),B=c(1,99,2,999))
 dta
    A   B
1 999   1
2   1  99
3   2   2
4   3 999
 dta[dta==999]<-NA #remplacement de tous les 999 par NA
 dta
   A  B
1 NA  1
2  1 99
3  2  2
4  3 NA
mean(dta$A,na.rm=T) #calcul de la moyenne de la colonne A

Tu supprime les 999 au moment du calcul

Code : Tout sélectionner

#creation d'un jeu de données bidon pour l'ex
dta<-data.frame(A=c(999,1:3),B=c(1,99,2,999))
 dta
    A   B
1 999   1
2   1  99
3   2   2
4   3 999
mean(dta$A[dta$A!=999])


Serge


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Google [Bot] et 1 invité