aide à l'interprétation de graphs d'ajustement

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

E.H. [compte supprimé]

aide à l'interprétation de graphs d'ajustement

Messagepar E.H. [compte supprimé] » 24 Mai 2007, 13:58

Bonjour,

Je souhaiterais revenir sur l'AIC, et notamment sur le contenu du pdf de Renaud ftp://ftp.cirad.fr/pub/group-r/groupe-r/Fiches/AIC_v3.pdf .

Je cite : " il est necessaire de verifier que le modèle complet ajuste correctement les données etc..."

Bon, j'arrive pas à le faire sous R, mais ce n'est pas grave car Splus me permet d'y arriver.
Je vous joins 2 graphs :

1ere situation
1) Reponse / Ajustement : http://marmottemanu.free.fr/share/gur/reponse_vs_fit.jpg
2) Quantile / Quantile http://marmottemanu.free.fr/share/gur/qq_plot.jpg
3) Residus / Ajustement : http://marmottemanu.free.fr/share/gur/residuals_vs_fit.jpg

Je n'ai jamais eu à interpréter ce type de graphiques, je ne sais donc pas trop ce qu'ils m'apportent comme information. Serait il possible que vous m'expliquiez ?

pour le 1) je suppose que l'ajustement est correct lorsque la droite pleine (reponse) est confondue avec la droite en tirets (ajustement). ce qui semble être le cas. mais que penser de l'ensemble des points positionnés qui eux sont très éloignés de ma droite de réponse ?
pour le 2) le principe est sans doute le meme, si mes points sont correctement confondus avec ma droite en pointillés, c'est que le modele complet est ajuste correctement les données. Que penser dans cette situation ? a priori je dirais que c'est bon
Pour le 3) honnetement j'ai aucune idée de l'interprétation...


2eme situation :

1) Reponse / Ajustement : http://marmottemanu.free.fr/share/gur/reponse_vs_fit_1.jpg
2) Quantile / Quantile http://marmottemanu.free.fr/share/gur/qq_plot_1.jpg
3) Residus / Ajustement : http://marmottemanu.free.fr/share/gur/residuals_vs_fit_1.jpg

J'aurais tendance à dire d'apres le graph QQ, que ca colle pas tout à fait

Situation un peu plus extrème :
2) Quantile / Quantile http://marmottemanu.free.fr/share/gur/qq_plot_2.jpg
là, ca colle plus du tout ?

Etes vous d'accord ? Pourriez vous me donner plus d'infos et vos remarques ?

Merci d'avance


-- edit --

Code : Tout sélectionner

> aov0 <- aov(formula = ASRF3 ~ an * ta * co * ty, data = fcb)
> X2 <- sum(residuals(aov0, type = "pearson")^2)
> ddl<-aov0$df.residual
> 1-pchisq(X2, ddl)
[1] 1


tous mes calculs du test basé sur l'ajustement de pearson me donnent 1 en résultat, quelque soit ma base de donnée source, est ce normal ? probleme de données ? calcul non valable dans le cas de aov ? faut il passer par anova(lm()) ?

Renaud Lancelot
Messages : 2484
Enregistré le : 16 Déc 2004, 08:01
Contact :

Re: aide à l'interprétation de graphs d'ajustement

Messagepar Renaud Lancelot » 24 Mai 2007, 16:18

Emmanuel Henke a écrit :Bonjour,

Je souhaiterais revenir sur l'AIC, et notamment sur le contenu du pdf de Renaud ftp://ftp.cirad.fr/pub/group-r/groupe-r/Fiches/AIC_v3.pdf .

Je cite : " il est necessaire de verifier que le modèle complet ajuste correctement les données etc..."

Bon, j'arrive pas à le faire sous R, mais ce n'est pas grave car Splus me permet d'y arriver.


A priori, exactement pareil entre S+ et R. Si fm est votre modèle, plot(fm) donne bcp d'indications !

Je réponds brièvement, mais votre message tombe dans le cadre de la discussion de ce jour sur ce qu'on peut attendre d'un tel forum. Il ne peut pas se substituer à un cours de stats. Les questions que vous posez sont traitées dans tout bon bouquin sur le modèle linéaire, dont certains sont disponibles en ligne et indiqués sur ce forum dans la rubrique Liens.

Bref: do your homework !

Je vous joins 2 graphs :

1ere situation
1) Reponse / Ajustement : http://marmottemanu.free.fr/share/gur/reponse_vs_fit.jpg
2) Quantile / Quantile http://marmottemanu.free.fr/share/gur/qq_plot.jpg
3) Residus / Ajustement : http://marmottemanu.free.fr/share/gur/residuals_vs_fit.jpg

Je n'ai jamais eu à interpréter ce type de graphiques, je ne sais donc pas trop ce qu'ils m'apportent comme information. Serait il possible que vous m'expliquiez ?

pour le 1) je suppose que l'ajustement est correct lorsque la droite pleine (reponse) est confondue avec la droite en tirets (ajustement). ce qui semble être le cas. mais que penser de l'ensemble des points positionnés qui eux sont très éloignés de ma droite de réponse ?


Si les points sont les valeurs ajustées en fct des observations, ça veut dire que le modèle ajuste mal les données en ce sens qu'il ne rend pas bien compte de la variabilité de la réponse. Avec un modèle parfait, les points seraient alignés sur la bissectrice.

pour le 2) le principe est sans doute le meme, si mes points sont correctement confondus avec ma droite en pointillés, c'est que le modele complet est ajuste correctement les données. Que penser dans cette situation ? a priori je dirais que c'est bon


Ce graphe est fait pour examiner la distribution des résidus, censée être normale dans un modèle linéaire. Si la distribution est normale, les points sont alignés sur la bissectrice. Ici, pas tout à fait le cas mais rien de dramatique.

Pour le 3) honnetement j'ai aucune idée de l'interprétation...


Renseigne sur l'homogénéité de la variance des résidus: dans le modèle linéaire standard, la variance résiduelle est constante qque soient les valeurs ajustées. Pas merveilleux ici mais a priori pas trop grave. A tester.

Bon courage,

Renaud

Nicolas Péru
Messages : 1408
Enregistré le : 07 Aoû 2006, 08:13

Messagepar Nicolas Péru » 25 Mai 2007, 06:21

il me semble aussi que les graphiques 2 et 3 pemettent de vérifier l'indépendance des résidus. C'est à dire qu'il ne faut pas observer une forme particulière du nuage de point comme par exemple une parabole s'il manquait un terme en X² dans le modèle.
Si on regarde surtout le graphique 3 (résidual vs fitted) on voit que les valeurs de résidus les plus importantes sont aux extrêmes, ce n'est pas très bon signe. Si tous les points des extrémités avaient une valeur résiduelle forte, je te dirai d'ajouter un terme en X² mais pour tes modèles c'est moins évident (peut être un problème de dispersion du modèle). Alors tu peux essayer pour voir si un terme en X² améliorerait ton modèle. Un graphique de l'influence des valeurs (type distance de cook) serait pas mal aussi pour aider à clarifier un peu le problème.

Ce n'est peut être pas très important comme problème mais tes résidus ne sont peut être pas parfaitement indépendants...ce qui peut être gênant.

Nicolas

E.H. [compte supprimé]

Messagepar E.H. [compte supprimé] » 25 Mai 2007, 11:48

Bonjour et merci de vos réponses.

Je n'irais pas plus loin dans mes questions, au risque d'être encore "dans le cadre de la discussion de la veille" concernant ce forum et sa volonté de rester centré sur la technique et l'utilisation du logiciel.


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité