Bonjour, je suis nouveau sur votre forum
je commence un stage dans une mutuelle et la mission est d'effectuer des analyses de données sous R à partir de tables SAS.
Le hic c'est que mes tables sont ENORMES et en tant qu'étudiant je n'ai jamais manipuler d'aussi gros amas de données.
j'ai déja effectué quelques recherches et je pense me servir du package ade4 et essayer Factominer.
j'ai aussi vu sur votre forum des histoires d'enveloppes convexes que je vais creuser.
j'ai donc plusieurs questions : y a t il une méthode préférable aux autres quand à l'importation de tables SAS vu leur taille (je dois tout faire de manière automatisée de manière à ce que l'équipe stat n'ai qu'à taper quelques noms de macros ou de fonction et que tout se face, il me faut donc des méthodes robustes).
j'ai pour l'instant implémenter la méthode avec les fichiers xpt et une autre avec les csv mais je ne sais pas si elles sont aussi sures l'une que l'autre, en particulier pour les variables qualitatives.
Par ailleurs la méthode csv ne pose t elle pas de problèmes pour la relacture si les données contiennent des chiffres à virgule ?
sinon je suis preneur de tous conseils et avis si vous connaissez quelque chose sur ce sujet, et surtout sur les difficultées que je pourrais rencontrer avec de telles BDD.
merci