Qu'entendez vous par code reproductible ?
Je suis encore débutant avec R et ne connais pas encore les termes.
voiçi un exemple complet de mon problème :
Code : Tout sélectionner
injection body_length
1 inj_WT 3.123
2 inj_WT 3.050
3 inj_WT 3.105
4 inj_WT 3.080
5 inj_WT 3.228
6 inj_WT 2.884
7 inj_WT 3.126
8 inj_WT 2.993
9 inj_WT 3.235
10 inj_WT 2.853
11 inj_WT 2.782
12 inj_WT 3.166
13 inj_WT 3.076
14 inj_WT 3.083
15 inj_WT 3.101
16 inj_WT 3.301
17 inj_WT 2.891
18 inj_WT 3.069
19 inj_WT 3.166
20 inj_WT 3.226
21 inj_WT 3.168
22 inj_WT 3.128
23 inj_WT 3.157
24 inj_WT 2.785
25 inj_WT 3.128
26 inj_WT 3.066
27 inj_WT 3.243
28 inj_WT 3.207
29 inj_WT 3.141
30 inj_WT 3.127
31 inj_WT 3.191
32 inj_WT 3.425
33 inj_WT 3.160
34 inj_WT 3.088
35 inj_WT 3.130
36 inj_WT 3.214
37 inj_WT 3.018
38 inj_WT 3.172
39 inj_WT 3.162
40 inj_WT 3.049
41 inj_WT 3.298
42 inj_WT 3.068
43 inj_WT 3.240
44 inj_WT 3.125
45 inj_WT 3.204
46 inj_WT 3.269
47 inj_WT 2.952
48 inj_WT 3.046
49 inj_WT 2.771
50 non_inj 3.246
51 non_inj 3.237
52 non_inj 2.910
53 non_inj 3.154
54 non_inj 3.296
55 non_inj 3.183
56 non_inj 2.851
57 non_inj 3.185
58 non_inj 3.291
59 non_inj 3.219
60 non_inj 3.250
61 non_inj 3.038
62 non_inj 3.324
63 non_inj 3.099
64 non_inj 3.113
65 non_inj 3.216
66 non_inj 3.215
67 non_inj 3.246
68 non_inj 2.981
69 non_inj 3.158
70 non_inj 3.094
71 non_inj 3.224
72 non_inj 3.250
73 non_inj 3.124
74 non_inj 3.278
75 non_inj 2.850
76 non_inj 3.240
77 non_inj 3.259
78 non_inj 3.231
79 non_inj 3.227
80 non_inj 2.897
81 non_inj 2.886
82 non_inj 2.922
83 non_inj 3.357
84 non_inj 3.327
85 non_inj 2.894
86 non_inj 2.950
87 non_inj 3.327
> outlier_inj_WT <- boxplot.stats(DATA[DATA["injection"]=="inj_WT",c("body_length")])$out
> show(outlier_inj_WT)
[1] 2.853 2.782 2.785 3.425 2.771
> outlier_inj_WT_idx <-which(DATA$body_length %in% c(outlier_inj_WT))
> show(outlier_inj_WT_idx)
[1] 10 11 24 32 49
> DATA_WO=DATA[c(-outlier_inj_WT_idx)]
> DATA_WO
injection body_length
1 inj_WT 3.123
2 inj_WT 3.050
3 inj_WT 3.105
4 inj_WT 3.080
5 inj_WT 3.228
6 inj_WT 2.884
7 inj_WT 3.126
8 inj_WT 2.993
9 inj_WT 3.235
10 inj_WT 2.853
11 inj_WT 2.782
12 inj_WT 3.166
13 inj_WT 3.076
14 inj_WT 3.083
15 inj_WT 3.101
16 inj_WT 3.301
17 inj_WT 2.891
18 inj_WT 3.069
19 inj_WT 3.166
20 inj_WT 3.226
21 inj_WT 3.168
22 inj_WT 3.128
23 inj_WT 3.157
24 inj_WT 2.785
25 inj_WT 3.128
26 inj_WT 3.066
27 inj_WT 3.243
28 inj_WT 3.207
29 inj_WT 3.141
30 inj_WT 3.127
31 inj_WT 3.191
32 inj_WT 3.425
33 inj_WT 3.160
34 inj_WT 3.088
35 inj_WT 3.130
36 inj_WT 3.214
37 inj_WT 3.018
38 inj_WT 3.172
39 inj_WT 3.162
40 inj_WT 3.049
41 inj_WT 3.298
42 inj_WT 3.068
43 inj_WT 3.240
44 inj_WT 3.125
45 inj_WT 3.204
46 inj_WT 3.269
47 inj_WT 2.952
48 inj_WT 3.046
49 inj_WT 2.771
50 non_inj 3.246
51 non_inj 3.237
52 non_inj 2.910
53 non_inj 3.154
54 non_inj 3.296
55 non_inj 3.183
56 non_inj 2.851
57 non_inj 3.185
58 non_inj 3.291
59 non_inj 3.219
60 non_inj 3.250
61 non_inj 3.038
62 non_inj 3.324
63 non_inj 3.099
64 non_inj 3.113
65 non_inj 3.216
66 non_inj 3.215
67 non_inj 3.246
68 non_inj 2.981
69 non_inj 3.158
70 non_inj 3.094
71 non_inj 3.224
72 non_inj 3.250
73 non_inj 3.124
74 non_inj 3.278
75 non_inj 2.850
76 non_inj 3.240
77 non_inj 3.259
78 non_inj 3.231
79 non_inj 3.227
80 non_inj 2.897
81 non_inj 2.886
82 non_inj 2.922
83 non_inj 3.357
84 non_inj 3.327
85 non_inj 2.894
86 non_inj 2.950
87 non_inj 3.327
Comme vous pouvez le constater, la fonction boxplot.stat me ressort bien des outlier ainsi que leurs index, mais cette ligne ci : DATA_WO=DATA[c(-outlier_inj_WT_idx)] ne fonctionne pas et mes outliers se retrouvent dans mon jeu de donnée ''DATA_WO''.
Il y a surement une erreur bête et méchante mais impossible de mettre le doigt dessus.