flynttcher mako a écrit :Bonjour, étant débutant en R j'aimerais savoir la différence entre Anova utilisé avec la librairie "car" et anova tout court (je n'arrive pas a trouver des documents sur leur différence),
Anova (package car) présente les résultats d'analyse de variance selon des méthodes proposées en standard dans SAS et souvent réclamées par les anciens utilisateurs de ce logiciel et/ou les referees des journaux: somme des carrés de type II et III. Elles ne sont pas présentées dans les sorties standards de la fct anova.
par ailleurs je dois faire un choix entre un modèle de régression linéaire multiple et un modèle d'analyse de variance avec les mêmes données que le modèle linéaire sauf que mes variables explicatives (quantitatives) du 1er modèle deviennent des variables qualitatives (facteur).
Alors j'aimerais savoir sur quoi doit se baser mon choix, j'ai pensé à comparer leur coefficient d'ajustement R pour les départager mais je n'en suis pas convaincu.
Pas de réponse simple. On peut penser au critère d'information d'Akaike (AIC) pour comparer des modèles (ce n'est pas un test, mais un critère), mais les puristes soulignent que l'AIC et ses collègues (AICc, BIC,...) ne doivent être utilisés que dans le cas de modèles emboités, ce qui ne correspond pas à votre situation.
Le coefficient R2 vous donne la proportion de variance expliquée par le modèle. Il ne tient pas compte de la parcimonie du modèle. Vous pouvez aussi regarder les résidus, ce qui est très utile pour détecter des variations systématiques pas prises en compte par une tendance linéaire.
Le gros pb est souvent là avec les variables quantitatives: savoir si une tendance linéaire capture correctement l'effet de la variable. Il est souvent nécessaire d'intégrer des termes quadratiques, cubiques,... pour capturer la tendance. Vaste sujet. Il est toujours utile et indispensable d'effectuer une exploration graphique soigneuse avant de choisir le modèle approprié.
Renaud