Equivalent de stepwise de Splus en R?

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

solenne carat
Messages : 1
Enregistré le : 05 Mar 2007, 15:28

Equivalent de stepwise de Splus en R?

Messagepar solenne carat » 06 Mar 2007, 08:16

Bonjour,
je dois utiliser un programme qui lance un script Splus. N'ayant pas de licence Splus, je pensais pouvoir l'executer en R sans problème, étant donné que ces 2 langages sont très proches. Mais je rencontre un problème avec la méthode stepwise de R, pour laquelle je ne trouve pas d'équivalent en R. cette méthode permet de faire de la régression linéaire.
Es-ce qu'il existe un package dans R pour le rendre compatible avec R? ou avez vous d'autres solutions?

merci d'avance

Romain François
Messages : 42
Enregistré le : 08 Déc 2005, 19:23
Contact :

Messagepar Romain François » 06 Mar 2007, 12:50

?step
--
Romain François
Consultant R Indépendant
http://romainfrancois.blog.free.fr

Renaud Lancelot
Messages : 2484
Enregistré le : 16 Déc 2004, 08:01
Contact :

Messagepar Renaud Lancelot » 06 Mar 2007, 23:01

Attention danger, tu rentres dans la zone délicate du pb de la sélection des modèles :-).

Cela fait longtemps que je n'ai plus utilisé S+ mais je me rappelle que stepwise faisait du pas-à-pas classique, ce qui est à proscire pour de multiples raisons (voir la fiche sélection de modèles sur ce forum). La fct setp indiquée par Romain ou la fct stepAIC (dans MASS) fonctionnent avec le critère AIC (ou le BIC, voire le Cp de Mallows). Ce n'est pas la même chose que stepwise.

Renaud

Nicolas Péru
Messages : 1408
Enregistré le : 07 Aoû 2006, 08:13

Messagepar Nicolas Péru » 07 Mar 2007, 06:19

le problème de la stepwise (step sous R) c'est qu'on ne sait pas réellement comment les variables sont déterminées comme valide ou non...c'est un peu la face cachée de la lune :).
Je ne suis pas un spécialiste de la question mais pour avoir discuté avec des personnes très au courant sur le sujet, il vaut mieux, si possible bien sûr, se tourner vers d'autres méthodes de sélection de variables.


Pas d'accord. La manière dont est programmée la fonction step (ou stepAIC) repose sur une base théorique solide, interprétée de manière très orthodoxe par B. Ripley qui l'a programmée. Voir les publis citées dans l'aide ainsi que les nombreuses discussions à ce sujet dans R-Help, ou faire une recherche via google.

L'objectif de la méthode (i.e., le résultat de step) est de choisir le modèle ayant la meilleure valeur prédictive possible, ce qui aboutit parfois à retenir une ou plusieurs variables qui ne seraient pas considérées comme significatives avec un test de Wald ou un test du rapport des vraisemblances. Cependant, il est de très loin préférable d'utiliser step ou des méthodes analogues, plutôt que de recourir à une régression pas-à-pas classique telle qu'on peut en trouver programmées dans la plupart des logiciels de stats. Comme évoqué dans la fiche citée dans une première réponse, ces méthodes pas-à-pas n'ont pas de base théorique.

Renaud

Nicolas Péru
Messages : 1408
Enregistré le : 07 Aoû 2006, 08:13

Messagepar Nicolas Péru » 22 Mar 2007, 14:24

le fait n'est pas de critiquer la programmation sous R de la stepwise autrement dit je ne parle absolument pas de l'aspect informatique de la chose mais simplement de la base statistique de la régression pas à pas qui lui est sévèrement critiqué par certains statisticiens pour son côté un peu aléatoire.
Tous ne sont pas d'accord bien évidemment mais dans ce cas il faut tout de même faire attention déjà que lorsque les spécialistes sont d'accord sur les forces et faiblesses d'une analyse ils nous disent de faire bien attention à l'interprétation des résultats alors je me méfie d'autant plus pour la stepwise tout aussi bien programmée qu'elle soit sous R ou Splus.

Renaud Lancelot
Messages : 2484
Enregistré le : 16 Déc 2004, 08:01
Contact :

Messagepar Renaud Lancelot » 22 Mar 2007, 17:26

On ne se comprend pas.

1. Sous S+, anciennement (je ne sais pas si ça a changé), la fct stepwise utilisait une méthode de sélection pas-à-pas basée sur le F. C'était la méthode "normale" dispo dans tous les logiciels de stats de SPSS à SAS. Il s'avère que cette méthode ne repose sur aucune théorie: c'est la généralisation de la comparaison de deux modèles emboîtés à l'aide du F ou du chi2, mais ça ne marche pas quand bcp de modèles sont comparés.

2. En revanche, la fct actuelle step disponible sous R, qui est la simplification de la fct stepAIC disponible depuis très lgtps dans le package MASS (R et S+), n'est PAS basée sur la même théorie. La sélection se fait sur la base de critères d'information (AIC ou BIC), selon une méthode pour laquelle il y a une théorie solide. Il s'avère que la méthode a tellement de succès que les gens l'utilisent en dehors du cadre bien précis pour laquelle elle a été élaborée ce qui provoque les foudres des puristes. Mais pas de doute, si on reste dans les clous, on a bel et bien une méthode éprouvée de sélection de modèles pas-à-pas.

Il y a une fiche sur cette question sur ce forum (rubrique Fiches). Pour en savoir plus, voir par exemple

Burnham, K. P. & Anderson, D. R. Model selection and multimodel inference: a practical information-theoretic approach. Springer-Verlag, 2002

ou

http://www.stats.ox.ac.uk/~ripley/Nelder80.pdf

Renaud


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Google [Bot] et 1 invité