Bonjour,
Je travaille sur une base ACCESS en local je cherche à faire du nettoyage, en créant un code réutilisable sur cette "base".
Oui, "base" car le fichier access contient qu'une seule table de 36K lignes et une centaine de colonnes, autrement dit c'est un tableau excel dans access. Tout ceci est en cours d'amélioration, pour le moment je dois faire avec ça...
Pas de problème pour me connecter la base, l'importer dans R, nettoyer les colonnes qui existent puis traduire en SQL pour update la base directement. (étant en phase de test je travaille sur une copie)
Le problème c'est que j'ai un champ à corriger qui nécessite de croiser la base avec d'autres tableaux..
Je fais ma tambouille avec R (data.table etc.. ) et ensuite je converti en SQL mais pour update un nouveau champ qui ne dépend pas uniquement de ma base c'est pas simple, on peut pas mettre à jour par colonne...
J'ai testé donc plusieurs solutions (toutes à partir de R uniquement) :
1. faire mon nettoyage/correction dans R et réexporter ma table en fichier Access en gardant les infos de la base telle que les description des champs..
2. Ajouter une table temporaire dans le fichier access et pouvoir faire une jointure pour avoir ma base + nouvelles colonnes, je ne suis pas sur de pouvoir garder les metadonnées d’access en faisant ça..
3. Créer via Alter table cette nouvelle colonne initialisée NA dans Access, puis via un update...
4. Pouvoir update ma table en faisant une jointure avec un DF (sens variable de R)
Si vous avez d’autres idées/solutions ?
Merci
--