test sur le rang : comparaison de plus de 2 échantillons

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

camille garcin
Messages : 76
Enregistré le : 24 Nov 2009, 10:07

test sur le rang : comparaison de plus de 2 échantillons

Messagepar camille garcin » 13 Avr 2015, 13:19

Bonjour
J’ai présenté 40 photos de profils à 350 orthodontistes. Leur réponse sont codées en 2 catégories : 1= harmonieux, 0 = disharmonieux). Les données sont là : https://www.dropbox.com/s/ot9s5sbenj6r3m6/data.rdata?dl=0.
Je souhaite savoir s’il existe un effet significatif pour le sexe (respectivement l’âge, la fac d’origine, etc.) de l’orthodontiste et son jugement.
J’ai regroupé les données dans des tables de contingence de taille 40*2 pour le sexe, 40*3 pour l’âge (il y a 3 classes d’âge) pour procéder à un test du chi-2

Code : Tout sélectionner

> chisq.test(df1[,1],df1[,2])

        Pearson's Chi-squared test

data:  df1[, 1] and df1[, 2]
X-squared = 986.6667, df = 899, p-value = 0.02172

Message d'avis :
In chisq.test(df1[, 1], df1[, 2]) :
  l'approximation du Chi-2 est peut-être incorrecte

Cette p-value est-elle interprétable malgré l'avertissement ?
J’ai ensuite défini pour chaque profil un score correspondant au % d’individus d’une classe (d’âge, de sexe, etc.) le trouvant harmonieux puis procédé à un test de corrélation des rangs de Spearman.
J’obtiens ce message :

Code : Tout sélectionner

> cor.test(df1[,1],df1[,2],method='spearman')

        Spearman's rank correlation rho

data:  df1[, 1] and df1[, 2]
S = 203.8154, p-value < 2.2e-16
alternative hypothesis: true rho is not equal to 0
sample estimates:
      rho
0.9808804

Message d'avis :
In cor.test.default(df1[, 1], df1[, 2], method = "spearman") :
  Impossible de calculer les p-values exactes avec des ex-aequos

La p-value est-elle interprétable malgré tout ?
Comment faire pour comparer dans les cas ou il y a + de 2 modalités (exemple : classe d’âge, fac d’origine, etc.) ? Dois-je procéder à des regroupements ?
J’ai conscience que cette question est à la limite des objectifs du forum mais j’avoue que je suis un peu perdu…
Merci par avance de votre aide.
CG

Jérémy Jachacz
Messages : 153
Enregistré le : 15 Avr 2014, 12:56

Messagepar Jérémy Jachacz » 13 Avr 2015, 13:25

Bonjour,

je ne m'avancerai pas,
mais je tiens juste à faire quelques remarques :

- il y a un message quand vous faites le test du chi2 qui dit que le resultat peut être incorrecte c'est sans doute la faute au effectif theorique trop faible (<5) dans ce cas il me semble que l’interprétation de la p-value est compromise

- le résultat du deuxième test indique une p-value très faible, si je ne me trompe pas c'est la p-value la plus faible que peut donner R (<2.2e-16)
je pense que les ex-aequos y sont pour quelque chose !

malheureusement je n'ai pas assez de connaissances pour en dire plus..

Jérémy
Statisticien (69)

Maxime Hervé
Messages : 427
Enregistré le : 03 Mar 2010, 14:21
Contact :

Messagepar Maxime Hervé » 13 Avr 2015, 14:43

Bonjour,

je suis désolé mais vous ne flirtez pas avec les limites de ce forum, vous les avez franchies :)

Mais histoire de ne pas vous laisser sans piste, regardez donc du côté de la régression logistique (GLM pour données binaires).

Maxime


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Google [Bot] et 1 invité