J'ai un jeu de données qui provient d'un dénombrement.
Pour chaque année, sexe, age, activité , j'ai calculé le nombre de pathologies. J'ai donc un jeu de données où mes lignes s'apparentent à des cellules.
nbpst annee lage sexe activite
1 2001 -30 ans Homme Administration
1 2001 -30 ans Femme Administration
7 2001 -30 ans Femme Administration
15 2001 -30 ans Homme Administration
1 2001 -30 ans Homme Administration
1 2001 30-40 ans Femme Administration
1 2001 30-40 ans Homme Administration
1 2002 30-40 ans Femme Administration
2 2002 30-40 ans Homme Administration
7 2003 30-40 ans Femme Administration
4 2003 30-40 ans Homme Administration
Pour tester l'association entre le nombre de pathologies (nbpst) et l'annee (annee) j'utilise un test de corrélation.
Avec Spearman et Kendall j'utilise:
Code : Tout sélectionner
cor.test(nbpst,annee, method="kendall")
Code : Tout sélectionner
cor.test(nbpst,annee, method="spearman")
Pour Spearman j'ai le message suivant:
Impossible de calculer les p-values exactes avec des ex-aequos
Et pour Kendall, je n'ai pas de message et mes résultats sont les suivants :
Kendall's rank correlation tau
data: nbpst and annee
z = 3.736, p-value = 0.0001870
alternative hypothesis: true tau is not equal to 0
sample estimates:
tau
0.04551952
**************************
Spearman's rank correlation rho
data: patho5 and annee
S = 7788682760, p-value = 0.0001887
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
0.06151803
Il me semble que Kendall est plus robuste que spearman dans la gestion des ex-aequos.
Pour autant, es ce que mon test de kendall est valide d'autant plus que mes données proviennent d'un comptage? en traçant l'histogramme de ma variable nbpst, jobtient une forme qui s'apparente à du poisson.
Ya t-il réellement une perte de puissance avec le test de Kendall.
Par avance, je vous remercie de vos conseils.
Cordialement,