je souhaite tester l effet de 2 variables qualitatives (Type de banc et sexe) et leur interactions sur une variable quantitative (PL)
J'ai donc construit un modèle linéaire.
En appliquant la procédure stepAIC, je souhaite trouver le modèle le plus parcimonieux.
Code : Tout sélectionner
> PL <-stepAIC (lm(list_lip$PL~list_lip$Type_Banc+ list_lip$Sexe +list_lip$Type_Banc:list_lip$Sexe ),direction = c("both") )
Start: AIC=-22.87
list_lip$PL ~ list_lip$Type_Banc + list_lip$Sexe + list_lip$Type_Banc:list_lip$Sexe
Df Sum of Sq RSS AIC
<none> 16.065 -22.867
- list_lip$Type_Banc:list_lip$Sexe 1 1.321 17.386 -21.944
> PL$anova
Stepwise Model Path
Analysis of Deviance Table
Initial Model:
list_lip$PL ~ list_lip$Type_Banc + list_lip$Sexe + list_lip$Type_Banc:list_lip$Sexe
Final Model:
list_lip$PL ~ list_lip$Type_Banc + list_lip$Sexe + list_lip$Type_Banc:list_lip$Sexe
Step Df Deviance Resid. Df Resid. Dev AIC
1 33 16.06542 -22.86720
EN spécifiant direction = both, je pensais que la procédure allait enlever tt les variables une par une et comparer les AIC entre tt les combinaisons (et ordre) possibles.
Hors, il semble qu'elle ne retire que l'interaction puis la procédure s' arrête, car au premier pas l' AIC est plus grand sans l interaction.
Mais je n ai donc pas d info sur le modèle banc+ interaction (sans le sexe), ou sexe + interaction (sans la variable banc).
Code : Tout sélectionner
> summary(PL)
Call:
lm(formula = list_lip$PL ~ list_lip$Type_Banc + list_lip$Sexe +
list_lip$Type_Banc:list_lip$Sexe)
Residuals:
Min 1Q Median 3Q Max
-1.0489 -0.5580 -0.1189 0.2811 1.9411
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.6000 0.2104 7.605 9.42e-09 ***
list_lip$Type_BancO 0.9657 0.3373 2.863 0.00724 **
list_lip$Sexem 0.5589 0.3136 1.782 0.08393 .
list_lip$Type_BancO:list_lip$Sexem -0.7666 0.4654 -1.647 0.10900
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.6977 on 33 degrees of freedom
Multiple R-squared: 0.2353, Adjusted R-squared: 0.1658
F-statistic: 3.386 on 3 and 33 DF, p-value: 0.0295
Le stepAIC favorise le modèle complet alors que Les variables sexe et interaction sexe:banc ont des p-values > a 0.05. Leurs effets n'est donc pas "significatif". Ces informations ne sont t elle pas antagonistes ?
le R² est tres petit, mon modèle ne semble donc pas expliquer une part importante de la variance ?
Quel serait la conséquence de retirer l'estimation de l 'intercepte ? quel est la signification de ce paramètre ?