Je débute sur R et je dois effectuer une régression linéaire multiple.
J'ai une variable quantitative à expliquer (delaiT_P2) et 3 variables explicatives (DP2_BRAS, INC_POIDS, et INC_MOTIFADMISSION).
Voici une partie de mes données
Code : Tout sélectionner
delaiT_P2 DP2_BRAS INC_POIDS INC_MOTIFADMISSION
1 21.688657 DEM 90.0 ACR
2 97.035658 DEM 80.7 Autre
3 18.251100 Soins Usuel 105.5 ACR
4 97.064815 DEM 78.0 Post-op<e9>ratoire
5 74.057870 Soins Usuel 59.0 Autre
6 56.396803 Soins Usuel 77.0 Autre
7 80.550926 DEM 59.0 Choc septique
8 92.333333 Soins Usuel 85.5 Autre
9 95.443287 DEM 63.0 ACR
10 98.140046 DEM 72.0 Post-op<e9>ratoire
11 77.968750 Soins Usuel 104.5 Choc septique
12 97.960648 DEM 75.0 Autre
13 23.664251 Soins Usuel 68.0 Post-op<e9>ratoire
14 24.725694 Soins Usuel 80.5 Autre
15 89.756944 DEM 87.0 Insuffisance respiratoire aigu<eb>
17 57.668981 Soins Usuel 84.0 Insuffisance respiratoire aigu<eb>
18 94.890046 DEM 97.0 Insuffisance respiratoire aigu<eb>
19 68.686343 Soins Usuel 67.0 Insuffisance respiratoire aigu<eb>
20 19.871528 Soins Usuel 88.0 Autre
21 96.619213 DEM 102.0 Insuffisance respiratoire aigu<eb>
22 97.964120 Soins Usuel 73.0 Choc septique
Et voici ce que j'ai obtenu pour la régression:
Code : Tout sélectionner
Call:
lm(formula = D$delaiT_P2 ~ D$DP2_BRAS + D$INC_POIDS + D$INC_MOTIFADMISSION)
Coefficients:
(Intercept)
38.6822
D$DP2_BRASSoins Usuel
-19.4478
D$INC_POIDS
0.1852
D$INC_MOTIFADMISSIONAutre
28.5716
D$INC_MOTIFADMISSIONChoc septique
24.7130
D$INC_MOTIFADMISSIONInsuffisance r<e9>nale aigu<eb>
41.1171
D$INC_MOTIFADMISSIONInsuffisance respiratoire aigu<eb>
23.3892
D$INC_MOTIFADMISSIONNeurologique
38.6859
D$INC_MOTIFADMISSIONPost-op<e9>ratoire
28.5216
> summary(lm(D$delaiT_P2~D$DP2_BRAS+D$INC_POIDS+D$INC_MOTIFADMISSION)
+ )
Call:
lm(formula = D$delaiT_P2 ~ D$DP2_BRAS + D$INC_POIDS + D$INC_MOTIFADMISSION)
Residuals:
Min 1Q Median 3Q Max
-73.173 -18.590 6.226 17.117 54.492
Coefficients:
Estimate Std. Error
(Intercept) 38.6822 19.6662
D$DP2_BRASSoins Usuel -19.4478 6.1887
D$INC_POIDS 0.1852 0.1936
D$INC_MOTIFADMISSIONAutre 28.5716 11.9734
D$INC_MOTIFADMISSIONChoc septique 24.7130 12.8165
D$INC_MOTIFADMISSIONInsuffisance r<e9>nale aigu<eb> 41.1171 22.5292
D$INC_MOTIFADMISSIONInsuffisance respiratoire aigu<eb> 23.3892 13.2647
D$INC_MOTIFADMISSIONNeurologique 38.6859 12.6423
D$INC_MOTIFADMISSIONPost-op<e9>ratoire 28.5216 14.5356
t value Pr(>|t|)
(Intercept) 1.967 0.05284 .
D$DP2_BRASSoins Usuel -3.142 0.00239 **
D$INC_POIDS 0.957 0.34171
D$INC_MOTIFADMISSIONAutre 2.386 0.01951 *
D$INC_MOTIFADMISSIONChoc septique 1.928 0.05756 .
D$INC_MOTIFADMISSIONInsuffisance r<e9>nale aigu<eb> 1.825 0.07192 .
D$INC_MOTIFADMISSIONInsuffisance respiratoire aigu<eb> 1.763 0.08187 .
D$INC_MOTIFADMISSIONNeurologique 3.060 0.00306 **
D$INC_MOTIFADMISSIONPost-op<e9>ratoire 1.962 0.05340 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 27.82 on 76 degrees of freedom
Multiple R-squared: 0.2314, Adjusted R-squared: 0.1504
F-statistic: 2.859 on 8 and 76 DF, p-value: 0.007809
Mon problème est le suivant:
la variable INC_MOTIFADMISSION est qualitative à plusieurs modalités. J'ai obtenu ici les coefficients et p-value pour chacune des modalités mais je souhaiterais obtenir une p-value globale pour cette variable afin de savoir si elle est associée de façon significative au seuil 5% et si je la conserve ou non dans mon modèle.
Est-il possible d'obtenir une p-value globale pour une variable qualitative à plusieurs modalités dans un modèle linéaire?