lire une partie de données sous r

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

fatima machou
Messages : 38
Enregistré le : 25 Avr 2016, 09:22

lire une partie de données sous r

Messagepar fatima machou » 16 Jan 2018, 10:00

Bonjour,
j'ai un fichier de données(type de fichier :xlsx ou csv ou txt) qui contient 3 tables de format different,et je veux faire l'etudes juste sur 2 tables.
saviez vous comment je peux faire pour lire juste ce que je veux etudier comme données et quel est le meilleur format de fichier pour faciliter la lecture(txt,csv,xlsx)?
merci d'avance
cdt

Bertrand Vassor
Messages : 46
Enregistré le : 18 Sep 2017, 10:18

Re: lire une partie de données sous r

Messagepar Bertrand Vassor » 16 Jan 2018, 10:09

Bonjour,

Mon retour d'expérience est de tout mettre sous forme de fichiers csv. Soit les filtres sur les donées sont réalisé dans Excell soit dans R. Je préfère faire un tri préliminaire dans Excell pour ne rester concentré que sur les données à analyser.

Donc, autant de fichiers csv que de tables excell.

Cdlt.

fatima machou
Messages : 38
Enregistré le : 25 Avr 2016, 09:22

Re: lire une partie de données sous r

Messagepar fatima machou » 16 Jan 2018, 10:20

le probleme que je veux pas enlever les autres informations car je veux les mettre dans un rapport apres , je veux tout garder en etudiant que les parties que je veux.
est il possible ?
merci!
cdlt

Serge Rapenne
Messages : 1426
Enregistré le : 20 Aoû 2007, 15:17
Contact :

Re: lire une partie de données sous r

Messagepar Serge Rapenne » 16 Jan 2018, 10:55

Bonjour,

Effectivement le plus simple est le csv. Le package "xlsx" marche plutôt bien mais son utilisation est moins trivial qu'un bête read.table.

Serge

fatima machou
Messages : 38
Enregistré le : 25 Avr 2016, 09:22

Re: lire une partie de données sous r

Messagepar fatima machou » 16 Jan 2018, 11:04

Rebonjour,

Et du coup pour prendre que les parties qui m’intéressent je dois faire quoi comme commande ?

cdt

Mickael Canouil
Messages : 1315
Enregistré le : 04 Avr 2011, 08:53
Contact :

Re: lire une partie de données sous r

Messagepar Mickael Canouil » 16 Jan 2018, 11:51

Bonjour,

Le dernier package de Hadley Whickham (Rstudio), nommé "readxl" est particulièrement efficace pour lire les fichiers Excel et pour importer un onglet en particulier, sans devoir passer par une curation manuel dans Excel.
Le package "readxl" a aussi l'avantage de ne pas utiliser Perl ou Java.

Au passage, pour écrire des fichiers Excel sans dépendances à Java, il existe "writexl".

Pour ma part, je préfère considérer le fichier Excel (ou csv, etc.) comme un fichier brut et effectuer toutes les manipulations sous R. Tout cela dans une optique de reproductibilité.

Cordialement,
Mickaël
mickael.canouil.fr | rlille.fr

François Bonnot
Messages : 537
Enregistré le : 10 Nov 2004, 15:19
Contact :

Re: lire une partie de données sous r

Messagepar François Bonnot » 23 Jan 2018, 08:54

Bonjour,
Il faut se méfier des tableurs, ils ne nous veulent pas de bien.
J'adhère à un principe que certains pourront trouver trop radical:
"Toute donnée stockée dans un tableur est considérée comme perdue".
J'ai vu passer des générations de tableurs: Visicalc, Multiplan, Quattro Pro, Lotus... (je crois que j'en oublie). Qui peut aujourd'hui lire leur contenu? Qui sait ce que sera devenu Excel dans dix ans? Au delà d'erreurs célèbres:
http://www.sciencepresse.qc.ca/actualite/2013/04/19/gaffe-excel-blamer-auteurs-citent
combien d'erreurs passées inaperçues à cause de tableurs?
Lorsque je reçois des données sur tableur, mon premier réflexe est de les en extraire pendant qu'il en est encore temps et de les placer dans un fichier .txt qu'ensuite je lis avec R (sauvegarder le code de lecture avec le fichier de données est une pratique efficace).
Les archives en .txt datant de plusieurs décennies transmises par les générations précédentes ne posent pas de problème de lecture pour peu qu'elles soient correctement documentées.
François

jean lobry
Messages : 733
Enregistré le : 17 Jan 2008, 20:00
Contact :

Re: lire une partie de données sous r

Messagepar jean lobry » 27 Jan 2018, 19:56

François Bonnot a écrit :[...]
J'adhère à un principe que certains pourront trouver trop radical:
"Toute donnée stockée dans un tableur est considérée comme perdue".
[...]

Bonjour,

c'est tout le contraire du radicalisme, c'est du bon sens empirique !

bien amicalement,

jean lobry


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité