résultats d'aov ou lm

Couanais Pierre · Messagepar **Couanais Pierre** » 05 Mar 2007, 16:23

nicolas : le pb n'est pas forcément sur le fait qu'il y ait 1 ou 2 facteurs, c'est qu'ils soient associés à 1 regresseur en plus. En effet, je n'avais pas pensé à la corrélation temporelle, ca complique.... mais je vais effectuer le test de Bartlett

Maxime : je bloque dans le fait que je n'ai pas vu réellement d'explication concrete par exemple dans la signification des coefficients... car je veux savoir quelle niveau de facteur pese le plus sur mes données. mais je me trompe surement, la valeur du coef n'est peut etre pas si importante.

Logez Maxime · Messagepar **Logez Maxime** » 05 Mar 2007, 16:42

Couanais Pierre a écrit :Maxime : je bloque dans le fait que je n'ai pas vu réellement d'explication concrete par exemple dans la signification des coefficients... car je veux savoir quelle niveau de facteur pese le plus sur mes données. mais je me trompe surement, la valeur du coef n'est peut etre pas si importante.

En effet la valeur des coefficients n'est pas forcément liée avec l'importance de ton facteur, tu peux très bien avoir une relation du type y=0.003x + 2, avec le facteur x qui explique 99% de ta variance. Il faut que tu regardes du côté de l'anova de ton modèle et regarder quelle varaible explique le plus de variance.

Maxime

Nicolas Péru · Messagepar **Nicolas Péru** » 05 Mar 2007, 17:11

bonje répond avec un exemple d'anova avec 2 facteurs pour expliqué une réponse

voilà les données que j'ai générées. fac1 est un facteur à 3 niveaux (a,b,c) et fac2 un facteur à 2 niveaux (1 et 2). response est la variable observée (tirage aléatoire dans une loi normale).

Code : Tout sélectionner

 fac1 fac2 response
 [1,]    3    1    61.89
 [2,]    2    1    57.86
 [3,]    2    1    35.42
 [4,]    2    2    88.50
 [5,]    3    2   126.10
 [6,]    3    2    71.88
 [7,]    2    1    18.30
 [8,]    1    1    41.37
 [9,]    3    1    98.61
[10,]    2    1   121.57
[11,]    2    1   106.51
[12,]    3    2   180.48
[13,]    2    2   106.21
[14,]    3    2   130.82
[15,]    3    1    43.32
[16,]    1    2   170.91
[17,]    1    1    75.34
[18,]    3    2   158.25
[19,]    3    2   191.22
[20,]    2    2   146.42
[21,]    1    2     9.04
[22,]    1    2   171.39
[23,]    3    2    60.94
[24,]    3    2   147.15
[25,]    2    1   119.33
[26,]    1    1   129.73
[27,]    3    1    24.49
[28,]    3    2    92.37
[29,]    2    2   108.41
[30,]    2    2   186.12
[31,]    1    1    23.82
[32,]    3    1    95.74
[33,]    1    2    66.66
[34,]    1    1   120.00
[35,]    3    2    47.73
[36,]    1    2     4.01
[37,]    2    2    85.23
[38,]    2    1   139.61
[39,]    2    2   126.56
[40,]    1    1    89.66
[41,]    1    1    63.09
[42,]    3    1    35.36
[43,]    1    2   109.21
[44,]    2    1   115.40
[45,]    3    1    52.68
[46,]    1    2   111.24
[47,]    1    2   119.62
[48,]    1    2    92.80
[49,]    2    2   183.16
[50,]    1    2   125.31
[51,]    1    2    53.99
[52,]    2    2   112.53
[53,]    3    2   177.65
[54,]    2    1    64.39
[55,]    3    2    74.31
[56,]    2    2    74.81
[57,]    1    1   119.31
[58,]    1    1   219.70
[59,]    3    2    30.57
[60,]    2    2   146.29
[61,]    3    2    99.56
[62,]    1    1   155.45
[63,]    1    2   147.41
[64,]    3    2    78.26
[65,]    3    2    10.66
[66,]    3    2   164.29
[67,]    3    1    68.65
[68,]    1    1   171.09
[69,]    2    1   140.19
[70,]    1    1   191.67
[71,]    2    1    70.87
[72,]    3    2    46.21
[73,]    2    2   116.42
[74,]    3    2    69.65
[75,]    2    2   106.68
[76,]    2    1   -16.01
[77,]    2    2    67.45
[78,]    1    2   192.17
[79,]    3    1    75.48
[80,]    2    1   122.76
[81,]    1    2   183.74
[82,]    2    2   185.26
[83,]    2    1    97.51
[84,]    3    1    69.45
[85,]    1    2   112.83
[86,]    1    1   134.19
[87,]    1    2   142.74
[88,]    2    1    96.14
[89,]    3    1   112.58
[90,]    1    1   134.39

Je suppose le modèle linéaire (c'est très arbitraire et juste pour l'exemple) et additif sans interaction. Donc ici j'emet des hypothèses qui ne sont pas sans conséquence sur lé résultat obtenu.

Code : Tout sélectionner

> anova(lm(response~fac1+fac2))
Analysis of Variance Table

Response: response
          Df Sum Sq Mean Sq F value Pr(>F)  
fac1       2  10322    5161    2.08  0.131  
fac2       1  10574   10574    4.27  0.042 *
Residuals 86 212928    2476                 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Conclusion fac1 n'a pas d'effet significatif sur la variable response. Alors que fac 2 oui. Les résultats donnés par la fonction anova sont très limités. Si je veux en savoir plus je regarde la fonction summary:

Code : Tout sélectionner

> summary(lm(response~fac1+fac2))

Call:
lm(formula = response ~ fac1 + fac2)

Residuals:
    Min      1Q  Median      3Q     Max 
-122.30  -29.81   -1.89   30.74  115.35 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)    104.4       10.7    9.75  1.5e-15 ***
fac1b          -11.0       12.9   -0.86    0.394    
fac1c          -28.4       12.9   -2.20    0.030 *  
fac22           22.0       10.6    2.07    0.042 *  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

Residual standard error: 49.8 on 86 degrees of freedom
Multiple R-Squared: 0.0894,     Adjusted R-squared: 0.0576 
F-statistic: 2.81 on 3 and 86 DF,  p-value: 0.0440

Ici on en apprend un peu plus. Notamment le R² est de 0.09. Donc mon modèle explique moins de 10% de la variabilité. L'intercept (ordonnée à l'origine) est significativement différent de 0. Donc mon modèle ne passe pas par l'origine. On note que la modalité c du facteur 1 est significative. Cependant elle n'est signifaicative que par rapport à la modalité a prise comme témoin. Donc cela ne change rien à la conlusion tirée de l'anova. Quant au facteur 2 on ne voit apparaitre que la seconde modalité qui est elle aussi significative donc la modalité 2 apporte un effet siginificatif à la prédiction de response par rapport à la modalité 1 prise seule.
Les valeurs des coefs sont à reprendre pour exprimer ton modèle. Mais ici il vaut peut être mieux réécrire le modèle seulement avec le facteur2. il faut tester aussi si l'ordre d'entrée des variables change quelque chose ou non.

Voilà pour la démarche avec 2 facteurs. Il me semble que c'est ça que tu veux faire d'après ce que je comprend. Sinon je ne vois pas très bien :)

Couanais Pierre · Messagepar **Couanais Pierre** » 05 Mar 2007, 17:34

Ok dejà ca m'éclaire pas mal tout ca merci.

Plusieurs questions tout de même (si vous en avez pas marre de me répondre....) :

On note que la modalité c du facteur 1 est significative. Cependant elle n'est signifaicative que par rapport à la modalité a prise comme témoin

mais qu'en est il de la significativité de la modalité a?

avec un régresseur en plus cela ne change rien je suppose...?

dans mon exemple (sans penser pour l'instant à al corrélation des semaines...) comment interpréter le fait qu'une semaine n'est pas significative par rapport à une autre? vu que le choix de la semaine témoin est arbitraire...

bref je vais réfléchir aussi mais vous m'avez déjà bien aidé...

[/quote]

Nicolas Péru · Messagepar **Nicolas Péru** » 05 Mar 2007, 17:49

mais qu'en est il de la significativité de la modalité a?

l'anova révèle que le factueur a un effet donc la modalité a est siginificative ( je pense à vérifier), ensuite on ne fait que vérifier l'apport des autre modalités. Mais il est toujours intéressant (si cela a un sens) de changer la modalité témoin. C'est ce qu'on appelle modifier les contrastes d'un modèle et tout est expliqué ici : http://biom3.univ-lyon1.fr/R/fichestd/tdr334.pdf

avec un régresseur en plus cela ne change rien je suppose...?

non effectivement, en terme de technique sous R. Après d'un point de vue stat c'est autre chose bien sûr...

dans mon exemple (sans penser pour l'instant à al corrélation des semaines...) comment interpréter le fait qu'une semaine n'est pas significative par rapport à une autre? vu que le choix de la semaine témoin est arbitraire...

toujours bien penser au fait que R travail toujours avec un témoin. Si une modalité autre que le témoin n'est pas significative ce n'est pas pour autant que si tu la passe en témoin elle ne sera pas significative...elle n'apporte simplement rien de plus que prendre uniquement la modalité témoin. Comme l'a très justement dit maxime il faut regarder qu'elle est la modalité qui explique le plus de variabilité.

autre détail...lorsque tu fait un modèle linéiaire il faut toujours vérifier les plot.lm() car on peut avoir des surprises...notamment révéler une corrélation.

Couanais Pierre · Messagepar **Couanais Pierre** » 06 Mar 2007, 10:50

et est-il nécessaire de transformer mes modalités en indicatrices comme dans SAS?

Nicolas Péru · Messagepar **Nicolas Péru** » 06 Mar 2007, 11:03

non :)

Groupe des utilisateurs du logiciel R

résultats d'aov ou lm

Qui est en ligne