Bonjour,
La fonction step ne fonctionne pas comme les méthodes de régression pas-à-pas basée sur un test du F ou autre: l'algorithme recherche le modèle présentant le plus faible AIC ou BIC parmi une liste de modèles. Voir l'aide de step pour choisir entre AIC (le défaut) et BIC. Ces modèles doivent être emboîtés et avoir été ajustés sur les mêmes données avec la même variable réponse. Il faut également vérifier que le modèle le plus complexe inclus dans la sélection ajuste correctement les données.
Il y a une grosse théorie sous-jacente à step (théorie de l'information, distance de Kullback-Leibler, critères d'information, etc.). Un exemple de bouquin (contesté par certains statisticiens puristes) à lire est:
Burnham, K.P., Anderson, D.R., 2002. Model selection and multimodel inference: a practical information-theoretic approach., 2nd Edition. Springer-Verlag, New-York, 496 p.
Depuis quelques années, on voit se développer des techniques dans la lignée de ce qui est décrit dans le bouquin cité ci-dessus, notamment l'inférence à partir de l'ensemble des modèles en compétition, et non d'un seul modèle. Un package spécialisé est disponible sur le CRAN: BMA (bayesian model averaging) et un article récent de
R-News est consacré à ce package.
Voir également la
fiche consacrée à la sélection de modèles, disponible sur ce forum.
Cordialement,
Renaud