Comparaisons de moyennes : comparaisons d'échantillons et methodes de corrections de p-valeurs

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Auguste Blam
Messages : 4
Enregistré le : 18 Oct 2018, 06:39

Comparaisons de moyennes : comparaisons d'échantillons et methodes de corrections de p-valeurs

Messagepar Auguste Blam » 18 Oct 2018, 08:20

Bonjour à tous,

Par avance, excusez mes erreurs de "conventions", il s'agit du premier message que je poste sur ce forum :


Vérification des conditions d'application de tests paramétriques, pour laquelle je me mélange un peu les pinceaux

Voici une question assez générale, pour laquelle je trouve des infos contraires au fil de mes lectures...

Contexte :
Prenons une population "A", dont l'un des caractères suit la loi normale (ex : population mondiale, et la taille)
Dans le cadre d'une expérience nous faisons un échantillonnage "Aa" de cette population de 40 personnes.
Sur cet échantillon "Aa", on repartit les gens suivant si il font du sport ou non.

Nous avons donc un groupe "Aa - sport" et un groupe "Aa - non sport"

Je souhaite comparer si il existe une différence significative entre la taille moyenne des sportifs "Aa - sport" et la taille moyenne des non sportifs "Aa - non sport" :


Dois-je vérifier la normalité :
Uniquement de la distribution des tailles de mon échantillon total : "Aa" ?
Des distributions des tailles des groupes : "Aa-sport" et aussi "Aa-non sport" ?

Tel que je comprends les tests de comparaison de moyennes, j'aurais tendance à penser qu'il faut vérifier la normalité des données des groupes comparés plutôt que de l'échantillon total.

Pour ce qui est de l'égalité des variances :
Je compare bien celles des deux distributions des groupes : "Aa-sport" et "Aa-non sport" ?

Intérêt des comparaisons de moyennes pour de très petits échantillons :

Actuellement en thèse de biologie, j’éprouve du mal à juger de l’intérêt de tests stats pour certaines conditions :

Contexte :
Typiquement, je comparer la concentration d'une molécule A et B entre les feuilles deux variétés de plantes.
Disons la variété 1 et la variété 2.
Je dispose de 2 bacs contenant 10 plantes de la variété 1 et de 2 bacs contenant 10 plantes de la variété 2.
Je récolte les feuilles, pour un bac, des 10 plantes de la variété 1. Je broie le tout et j'obtiens une valeur de concentration pour la molécule A de mes 10 plantes , var1 bac1.
Je fais de même pour le reste et j'ai donc à la fin 4 valeurs de teneurs moyennes pour 10 plantes.
Teneur molécule Aa : var 1 bac 1
Teneur molécule Ab : var 1 bac 2
Teneur molécule Ba : var 2 bac 1
Teneur molécule Bb : var 2 bac 2

Je peux ensuite obtenir la moyenne de la teneur en molécule A de la variété 1, en faisant la moyenne Aa et Ab.
Pareil pour la variété 2 en faisant la moyenne Ba et Bb.

Je souhaite maintenant comparer les teneur moyennes A et B.
Cela revient à comparer 2 moyennes, calculées chacune à partir de 2 valeurs...

En biologie, nous aimons bien les p-valeurs, mais là je trouve ça limite.
Je peux obtenir une p-valeur de comparaison de moyennes avec un test non paramétrique de type wilcoxon, mais je trouve qu’interpréter le résultat est bancal vu le très faible nombre de points comparés.
J'ai tendance à penser que la meilleure option pour la comparaison reste la projection graphique des moyennes (type barplot) et de leurs écarts types, avec une discussion qui se passerait de tests-statistiques.
Qu'en pensez vous ?
Qu'elle est la meilleure façon de comparer des moyennes issues de très petits jeu de données ?

Méthodes d’ajustement de calculs de "p-valeurs"
Enfin la dernière question...

Lorsque je réalise des comparaisons de moyennes 2 à 2, j'ai le choix des méthodes d'ajustement de calcul de la p-value du type "BH", "holm", "bonferroni"....
Mais je ne sais absolument pas quelle méthode est préconisée dans un cas ou dans l'autre.
Pouvez vous m'éclairer ?
Là encore, par habitude j'utilise la correction de bonferroni, mais c'est vraiment par habitude plus que par compréhension.





Merci d'avance pour vos réponses ou discussions,
et merci aux courageux qui arrivent au bout de ces lignes...


Cdlt,

Auguste

Mickael Canouil
Messages : 1315
Enregistré le : 04 Avr 2011, 08:53
Contact :

Re: Comparaisons de moyennes : comparaisons d'échantillons et methodes de corrections de p-valeurs

Messagepar Mickael Canouil » 18 Oct 2018, 10:26

Bonjour,

IMPORTANT - Objectifs du forum

Cordialement,
Mickaël
mickael.canouil.fr | rlille.fr

Auguste Blam
Messages : 4
Enregistré le : 18 Oct 2018, 06:39

Re: Comparaisons de moyennes : comparaisons d'échantillons et methodes de corrections de p-valeurs

Messagepar Auguste Blam » 18 Oct 2018, 11:21

Bonjour,

Image

J'ai posé mes questions ici pour quelles soient redirigées éventuellement dans la rubrique "autre" , ne pouvant directement y poster...

Vous remerciant infiniment pour votre aide,
Cdlt,

Auguste

François Bonnot
Messages : 537
Enregistré le : 10 Nov 2004, 15:19
Contact :

Re: Comparaisons de moyennes : comparaisons d'échantillons et methodes de corrections de p-valeurs

Messagepar François Bonnot » 18 Oct 2018, 12:46

[Administrateur]
Bonjour,
Les questions purement statistiques sont effectivement hors sujet sur ce forum.
La question peut contenir une partie d'ordre statistique mais doit être en rapport étroit avec du code R ou un package de R.
La phrase que vous soulignez en rouge avait été laissée par erreur et je viens de la supprimer.
Cordialement.
François


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité