Encodage - Importations R

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Jean-Louis Pagnoux
Messages : 11
Enregistré le : 12 Déc 2019, 09:35

Encodage - Importations R

Messagepar Jean-Louis Pagnoux » 06 Déc 2022, 14:57

Bonjour,
J'ai un problème avec l'importation d'une table SAS, comportant une variable texte ressemblant à ceci (extrait) :

' de l''Eglise'
'''VILLIERS DE L''''ISLE A'''
HELENE BOUCHER
'''d''''Arï¿œe'''
'''de l'''' Encheval'''
/4 Avenue A. BRIAND (Bât. A)
/RÉSIDENCE ASTRÉE
1 All?©e des M?©l??zes
1 All?©e des Pr?©s Verts
1 Allée Jacqueline AURIOL

Comme on peut le constater, il y a un problème avec les caractères spéciaux, lié, vraisemblablement, à l'encodage de la variable.
J'ai essayé la fonction Encoding, pour vérifier l'encodage utilisé, mais, dans 95% des cas, cela me retourne "unknown"

Y aurait-il moyen de retrouver une variable "propre" (sachant que la fonction iconv, permettant de modifier l'encodage, nécessite de renseigner l'encodage initial ... qui est inconnu !) ?

Merci

Maxime Deniaux
Messages : 68
Enregistré le : 11 Fév 2022, 22:49
Contact :

Re: Encodage - Importations R

Messagepar Maxime Deniaux » 06 Déc 2022, 20:21

Bonsoir,

juste pour être sûr d'avoir compris, c'est bien l'extrait après importation, pas avant ?

Edit : je suis parti du principe que oui. Je ne suis pas très familier des problèmes d'encodage mais peut-être pourriez vous trouver votre solution sur cette page (https://www.book.utilitr.org/importsas.html) qui propose notamment d'exporter de SAS votre table en un autre format (comme .csv) et ensuite importer ce dernier fichier sur R plus facilement. Peut-être que cela ne vous arrange pas, mais ça peut éventuellement être une solution envisageable pour contourner le problème, en attendant que vous trouviez ou que quelqu'un vous dise comment régler le pb directement de R

Jean-Louis Pagnoux
Messages : 11
Enregistré le : 12 Déc 2019, 09:35

Re: Encodage - Importations R

Messagepar Jean-Louis Pagnoux » 07 Déc 2022, 08:17

Bonjour Maxime,
Merci pour votre réponse
Oui, il s'agit bien d'un extrait après l'importation.
J'ai effectivement suivi les conseils de la page d'UtilitR et l'extrait correspond à l'importation du CSV.
Il me semble que je n'ai pas d'autre moyen que de faire un listing des problèmes et de faire un gsub.
Plutôt fastidieux !!

Pierre-Yves Berrard
Messages : 1029
Enregistré le : 12 Jan 2016, 23:30

Re: Encodage - Importations R

Messagepar Pierre-Yves Berrard » 07 Déc 2022, 08:47

Bonjour,
Ne peut-on pas voir dans SAS l'encodage de la table dans la library sashelp.vtable ?
PY

Maxime Deniaux
Messages : 68
Enregistré le : 11 Fév 2022, 22:49
Contact :

Re: Encodage - Importations R

Messagepar Maxime Deniaux » 07 Déc 2022, 09:12

Jean-Louis Pagnoux a écrit :Bonjour Maxime,
Merci pour votre réponse
Oui, il s'agit bien d'un extrait après l'importation.
J'ai effectivement suivi les conseils de la page d'UtilitR et l'extrait correspond à l'importation du CSV.
Il me semble que je n'ai pas d'autre moyen que de faire un listing des problèmes et de faire un gsub.
Plutôt fastidieux !!


A mince ! Oui c'est sûr que faire tous les gsub à la main...pas difficile mais un peu chiant

Pierre-Yves Berrard a écrit :Bonjour,
Ne peut-on pas voir dans SAS l'encodage de la table dans la library sashelp.vtable ?


Effectivement il y a peut-être une commande qui semble donner l'encodage. Peut-être un espoir Jean-Louis ;)

https://support.sas.com/documentation/c ... ce27jg.htm


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité