Anonymisation des données

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

ameni melki
Messages : 40
Enregistré le : 24 Fév 2021, 14:54

Anonymisation des données

Messagepar ameni melki » 15 Mar 2021, 09:57

Bonjour,

Je veux anonymiser les 2/3 de la colonne "Name", c'est à dire je veux remplacer les 2/3 des noms par "abcd" par exemple:

Name
John Lennon
Edward Snowden
John Kennedy
Mahatma Gandhi
Nelson Mandela
Vandana Shiva

J'obtiens ça >>>>>>
Name
John Lennon
ABCD
ABCD
Mahatma Gandhi
ABCD
ABCD


il y a cette commande:
data$Name[data$Name%in% c("Edward Snowden","John Kennedy","Nelson Mandela,Vandana Shiva")]<-"ABCD"

Cette commande n'est pas pratique, car je travaille avec des grandes bases avec des milliers d’observations, donc c'est impossible d’écrire toutes les valeurs que je veux anonymiser.
je veux anonymiser d'une façon aléatoire >>>>> Est ce que vous connaissez une commande qui permet de remplacer les 2/3 d'une colonne par une autre valeur et d'une façon aléatoire.

J'ai essayé le package "anonymizer" mais il n'est pas disponible dans la version R installé sur mon PC(RStudio-1.3.1093)
C'est quoi la version Rstudio qui a ce package?
Merci pour votre aide

Fred Santos
Messages : 233
Enregistré le : 11 Avr 2009, 10:00
Contact :

Re: Anonymisation des données

Messagepar Fred Santos » 15 Mar 2021, 10:18

Bonjour,

Par exemple ceci ?

Code : Tout sélectionner

<- nrow(data)
data[sample(1:n, floor(2*n/3)), "Name"] <- "abcd"


Aussi, juste une précision accessoire là-dessus :
J'ai essayé le package "anonymizer" mais il n'est pas disponible dans la version R installé sur mon PC(RStudio-1.3.1093)
C'est quoi la version Rstudio qui a ce package?

La version de Rstudio et la version de R sont deux choses entièrement indépendantes, et la version de Rstudio n'a aucun impact sur la disponibilité des packages. C'est la version de R qui importe. Vous pouvez la connaître en tapant (par exemple) R.version.string dans la console R. Chez moi :

Code : Tout sélectionner

R.version.string

#> [1] "R version 4.0.4 (2021-02-15)"  

ameni melki
Messages : 40
Enregistré le : 24 Fév 2021, 14:54

Re: Anonymisation des données

Messagepar ameni melki » 15 Mar 2021, 15:20

Merci beaucoup, ça marche


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité