Projet: techniques de ré-échantillonnage(resampling)

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

dimitri vassal
Messages : 1
Enregistré le : 03 Fév 2016, 16:31

Projet: techniques de ré-échantillonnage(resampling)

Messagepar dimitri vassal » 03 Fév 2016, 18:41

Bonsoir à tous,
Je m'appelle dimitri, je suis nouveau sur le forum. Je suis actuellemnt étudiant en Master 2 statistiques / informatique et nous utilisons beaucoup R.
Dans le cadre d'un cours sur le ré-échantillonnage (resampling), il nous est demandé de crée un package R.

La création du package et des infos le concernant n'a pas l'air compliqué (tutoriel sur youtube) mais les fonctions à coder me posent problème. en lui même dont voici le cachier des charges:
- Il faut implémenter 4 techniques de réechantillonages (sous forme de 4 fonctions)
- Les techniques peuvent par exemple viser à déterminer le nombre de facteurs dans une analyse factorielle (ex. pour l’ACM, etc.), ou pour la détermination du nombre de groupes dans les méthodes de clustering (ex. gap statistic de Tibshirani et al.) ou le calcul des intervalles de confiance dans la régression ou l’estimation de la puissance de test, etc.

Je me suis renseigné sur les techniques qu'il donne en exemple, sur le gap statistic par exemple, mais celà semble vraiment complexe a coder et a y implémenter du ré-échantillonnage.

Je dois donc crée 4 fonctions représentant 4 applications différentes en y implémentant pour chacune une méthodes de ré-echantillonnage.
Nous avons un choix libre des techniques mises à part celles que nous avons déjà codées en cours, par exemple:
- utilisation de la validation croisée et du bootstrap pour le calcul de l'erreur de prédiction d'une variable selon la méthode C4.5(arbres de prédiction)
- utilisation du bootstrap pour détecter le nombre de facteurs à retenir dans une ACP à l'aide des valeurs propres.

Nous pouvons réutiliser le bootstrap et la validation croisée mais dans le cadre d'autres applications. Je sais qu'il existe d'autres méthodes de réechantillonnage ex: monte carlo, permutation test, leave one out (similaire à validation croisée). Les fonctions n'ont pas a avoir de rapports entre elles du tout.

Je viens vers vous au cas ou vous auriez des idées intéressantes d'applications que je pourrais coder en utilisant une technique de ré-échantillonage. Ou alors me donner des pistes pour les exemples qu'il nous a donné. Je suis un peu en train de stagner. Merci d'avance pour votre aide précieuse.

Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité