Grande différence de résultat avec Student et Wilcoxon

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

jean lobry
Messages : 733
Enregistré le : 17 Jan 2008, 20:00
Contact :

Re: Grande différence de résultat avec Student et Wilcoxon

Messagepar jean lobry » 06 Fév 2009, 21:54

Aline Laufer a écrit :Que dois-je envoyer? le fichier excel? ou un copier-coller des deux variables sous R? Et concrètement "dput" ça s'utilise comment (pour situer je viens juste d'apprendre à mettre un code R sur le forum...)


Bonjour Aline,

alors si tu arrives à mettre du code R sur le forum, tu as fais le plus dur, sans rire. Après, le problème c'est d'intéresser quelqu'un à ton problème. Les gens sont paresseux, au plus tu leur facilites le travail pour reproduire ton problème, au plus tu as des chances d'avoir des réponses.Tout le monde ici a R sous la main, mais tout le monde n'a pas tes données. C'est ici que dput te facilite la vie. Il donne une représentation de tes données, même complexes, que tout le monde peut copier/coller dans R. Pas une horreur de fichier excel qu'il prendrait un temps fou à comprendre. Non, simplement tes données à toi telles qu'elles sont sous R. Par exemple, supposons que mes données perso soient celles de data(crimtab), et que j'ai un problème avec elles, je peux faire un dput(crimtab) pour construire un bout de code du genre :

Code : Tout sélectionner

mesdonnees <-
structure(c(0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 0L, 2L,
1L, 1L, 0L, 0L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 1L, 2L, 3L, 1L, 1L, 1L, 2L, 2L,
0L, 2L, 3L, 3L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
1L, 2L, 3L, 2L, 2L, 2L, 3L, 4L, 4L, 5L, 2L, 6L, 3L, 2L, 0L, 3L,
0L, 2L, 0L, 1L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 0L, 0L, 0L, 0L, 1L, 1L, 2L, 3L,
7L, 5L, 9L, 6L, 6L, 12L, 12L, 7L, 5L, 4L, 5L, 1L, 2L, 0L, 1L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 1L, 1L, 2L, 0L, 0L, 3L, 3L, 6L, 9L, 14L, 14L,
14L, 15L, 22L, 21L, 10L, 9L, 11L, 4L, 9L, 2L, 2L, 1L, 0L, 1L,
0L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 1L, 2L, 5L, 4L, 4L, 14L, 16L, 27L, 24L, 31L,
26L, 30L, 24L, 29L, 17L, 13L, 17L, 11L, 12L, 4L, 2L, 2L, 0L,
1L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 1L, 0L, 0L, 3L, 3L, 6L, 15L, 10L, 27L, 37L, 24L,
38L, 26L, 56L, 33L, 37L, 30L, 15L, 10L, 8L, 4L, 5L, 4L, 1L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
1L, 0L, 1L, 0L, 3L, 1L, 3L, 7L, 7L, 14L, 27L, 26L, 29L, 39L,
58L, 57L, 39L, 37L, 35L, 27L, 19L, 13L, 6L, 8L, 2L, 1L, 1L, 1L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 3L, 1L, 3L, 1L, 10L, 17L, 24L, 27L, 26L, 26L, 38L,
48L, 48L, 41L, 32L, 42L, 22L, 23L, 10L, 7L, 3L, 0L, 1L, 1L, 0L,
3L, 0L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 1L, 0L, 1L, 2L, 4L, 10L, 7L, 20L, 24L, 22L, 34L, 38L, 45L,
34L, 35L, 39L, 28L, 17L, 13L, 12L, 12L, 3L, 7L, 2L, 1L, 0L, 1L,
1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 2L, 1L, 1L, 6L, 4L, 4L, 7L, 10L, 25L, 27L, 24L, 29L, 19L,
22L, 15L, 16L, 20L, 4L, 11L, 5L, 5L, 3L, 2L, 1L, 1L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 1L, 0L,
0L, 0L, 0L, 1L, 1L, 2L, 11L, 11L, 12L, 9L, 10L, 10L, 16L, 27L,
11L, 23L, 7L, 8L, 7L, 5L, 1L, 2L, 0L, 0L, 1L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 2L, 2L, 9L, 5L, 9L, 8L, 10L, 8L, 6L, 7L, 6L,
8L, 8L, 8L, 0L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
2L, 2L, 1L, 3L, 2L, 4L, 1L, 5L, 1L, 8L, 6L, 2L, 5L, 1L, 0L, 0L,
3L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 2L, 1L,
1L, 0L, 0L, 0L, 3L, 2L, 3L, 1L, 2L, 0L, 0L, 1L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 2L, 1L, 0L,
1L, 0L, 1L, 0L, 0L, 0L, 0L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 1L, 0L, 1L, 0L, 0L, 0L, 0L, 1L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L
), .Dim = c(42L, 22L), .Dimnames = list(c("9.4", "9.5", "9.6",
"9.7", "9.8", "9.9", "10", "10.1", "10.2", "10.3", "10.4", "10.5",
"10.6", "10.7", "10.8", "10.9", "11", "11.1", "11.2", "11.3",
"11.4", "11.5", "11.6", "11.7", "11.8", "11.9", "12", "12.1",
"12.2", "12.3", "12.4", "12.5", "12.6", "12.7", "12.8", "12.9",
"13", "13.1", "13.2", "13.3", "13.4", "13.5"), c("142.24", "144.78",
"147.32", "149.86", "152.4", "154.94", "157.48", "160.02", "162.56",
"165.1", "167.64", "170.18", "172.72", "175.26", "177.8", "180.34",
"182.88", "185.42", "187.96", "190.5", "193.04", "195.58")), class = "table")

plot(mesdonnees)


Que tout le monde peut exécuter sans effort en faisant un simple copier/coller du code dans sa propre console R (sous Linux, Mac ou windaube). Comme ça tout le monde est certain de bien parler de la même chose et d'avoir toutes les données nécessaires disponibles. Bon, bien entendu, ça ne marche que pour des petits jeux de données, mais ça peut aider dans un premier temps.

Amicalement,

Jean

Aline Laufer
Messages : 16
Enregistré le : 03 Déc 2008, 19:34

Grande différence de résultat avec Student et Wilcoxon

Messagepar Aline Laufer » 06 Fév 2009, 22:50

Merci de ces explications Jean!
Voilà mes deux variables ploblématiques en bivariée.



Code : Tout sélectionner

 mesdonnees<-structure(list(Sexe = structure(c(1, 2, 2, 1, 2, 1, 2, 2, 2,
 2, 2, 2, 2, 2, 2, 2, 2, 1, 1, 2, 1, 2, 1, 2, 1, 2, 1, 1, 1, 1,
 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 1, 1, 1, 1, 1, 2, 1, 2, 2, 1, 2,
 2, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 1, 1, 1, 2, 2, 2, 2,
 1, 2, 2, 2, 1, 2, 1, 2, 2, 2, 2, 2, 1, 2, 2, 2, 1, 2, 2, 2, 2,
 2, 2, 1, 2, 1, 1, 2, 2, 2, 2, 2, 2, 1, 1, 1, 2, 1, 1, 1, 2, 2,
 2, 2, 1, 1, 1, 2, 2, 2, 2, 1, 2, 2, 1, 2, 1, 2, 1, 2, 2, 1, 2,
 2, 2, 2, 1, 2, 1, 1, 2, 1, 2, 1, 1, 2, 2, 2, 2, 2, 2, 1, 1, 2
 ), .Label = c("F", "H"), class = "factor"), NbPartenaires = c(2,
 6, 10, NA, 7, 1, 12, 4, 1, 6, 3, 7, 7, 6, 10, 10, 5, 7, NA, 50,
 NA, 1, 0, 3, 1, 11, 1, NA, 1, 1, 2, 1, 25, 1, 2, 7, 3, 1, 4,
 1, 1, 2, 2, 4, 1, 7, 5, 4, 3, NA, 1, 28, 19, 1, 9, 3, 1, 4, 2,
 15, 5, 1, 1, 1, NA, NA, 0, 7, NA, 4, 6, 4, 15, 9, 1, 4, 2, 8,
 12, NA, 9, 9, 1, 7, 1, 5, 1, 3, 1, NA, 1, 7, 0, 10, 6, NA, 5,
 6, 1, 7, 3, 2, 1, 2, 5, 1, 1, 4, 1, 3, 15, NA, 10, 1, 7, NA,
 3, 5, NA, 2, 10, 3, 5, 3, 4, 10, 3, 1, 9, 9, 4, 3, 35, 2, 40,
 15, 12, 13, NA, 5, 3, 35, 9, 1, 5, NA, 2, 3, 11, 3, 8, 3, 15,
 29, 8, 2)), .Names = c("Sexe", "NbPartenaires"), row.names = c("1",
 "2", "3", "4", "5", "6", "7", "8", "9", "10", "11", "12", "13",
 "14", "15", "16", "17", "18", "19", "20", "21", "22", "23", "24",
 "25", "26", "27", "28", "29", "30", "31", "32", "33", "34", "35",
 "36", "37", "38", "39", "40", "41", "42", "43", "44", "45", "46",
 "47", "48", "49", "50", "51", "52", "53", "54", "55", "56", "57",
 "58", "59", "60", "61", "62", "63", "64", "65", "66", "67", "68",
 "69", "70", "71", "72", "73", "74", "75", "76", "77", "78", "79",
 "80", "81", "82", "83", "84", "85", "86", "87", "88", "89", "90",
 "91", "92", "93", "94", "95", "96", "97", "98", "99", "100",
 "101", "102", "103", "104", "105", "106", "107", "108", "109",
 "110", "111", "112", "113", "114", "115", "116", "117", "118",
 "119", "120", "121", "122", "123", "124", "125", "126", "127",
 "128", "129", "130", "131", "132", "133", "134", "135", "136",
 "137", "138", "139", "140", "141", "142", "143", "144", "145",
 "146", "147", "148", "149", "150", "151", "152", "153", "154",
 "155", "156"), class = "data.frame")
 
 plot(mesdonnees)



Merci!
Aline

Christophe Genolini
Messages : 698
Enregistré le : 12 Juin 2006, 21:37
Contact :

Messagepar Christophe Genolini » 19 Fév 2009, 12:44

up...
Personne ne sait ?

jean lobry
Messages : 733
Enregistré le : 17 Jan 2008, 20:00
Contact :

Messagepar jean lobry » 19 Fév 2009, 18:40

Bonjour Aline,

Cela commence à devenir plus clair :

Code : Tout sélectionner

plot(mesdonnees, las = 1, notch = TRUE, col = c("pink","lightblue"))


Tu es très loin de la normalité pour les deux groupes, tu n'as pas vraiment d'autre choix que d'utiliser le test non-paramétrique ici, le test paramétrique n'est pas assez robuste à la violation patente de normalité. C'est ce qui explique la différence de résultat entre les deux tests : il y en a un qui se viande complètement. Le graphique suivant illustre comment le test paramétrique se plante :

Code : Tout sélectionner

hist(mesdonnees$NbPartenaire, proba=TRUE,
 xlim = c(-50,50),
 xlab = "Nombre de partenaires",
 col = grey(0.7), border = grey(0.5),
 main = "Point de vue paramétrique")
 
sd <- sd(mesdonnees$NbPartenaire, na.rm=TRUE)
H <- mesdonnees[mesdonnees$Sexe == "H", 2]
xx <- seq(-50,50,le=255)
lines(xx, dnorm(xx,mean(H, na.rm = TRUE), sd), col = "blue")
 F <- mesdonnees[mesdonnees$Sexe == "F", 2]
lines(xx, dnorm(xx,mean(F, na.rm = TRUE), sd), col = "red")
rug(H, col = "blue")
rug(F, col = "red")


Ça arrive assez souvent quand il y a des contraintes de positivité.

Amicalement,

Jean

Aline Laufer
Messages : 16
Enregistré le : 03 Déc 2008, 19:34

Grande différence de résultat avec Student et Wilcoxon

Messagepar Aline Laufer » 23 Fév 2009, 13:42

Merci Jean...


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité