débutant : comment faire des tests (où trouver les tests) ?

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Fabrice Leclercq
Messages : 11
Enregistré le : 28 Jan 2010, 22:39

débutant : comment faire des tests (où trouver les tests) ?

Messagepar Fabrice Leclercq » 21 Oct 2010, 13:03

Bonjour,

je dois enseigner les tests en BTS agricole et je suis en train de m'y initier (et tout seul, c'est un peu dur ;-)).
Je tente de le faire à l'aide de R.

J'ai pris les données (essais de 7 modalités avec 4 répétitions (blocs)) dans le rapport d'un ancien élève et je tente de refaire son analyse d'expérimentation.


Les données sont ici (séparateur de données ; et séparateur décimal ,):
http://dl.dropbox.com/u/1478925/expe.csv

Un extrait du rapport là :
http://dl.dropbox.com/u/1478925/expe.pdf


L'élève a utilisé StatBox. J'aimerai trouver les équivalents R et Rcmdr

J'ai converti les données numériques Modalité et bloc en facteurs.

L'analyse commence par :
INTERACTION TRAITEMENTS*BLOCS
SCE test de TUKEY = 24.676 PROBA = 0.340022


Comment faire ce test ?

Plus loin, on teste la normalité des résidus avec :
INDICES DE NORMALITE (coefficients de K.PEARSON)
SYMETRIE (valeur idéale théorique = 0) : BETA 1 = 0.017 PROB : 0.76596
APLATISSEMENT (valeur idéale théorique = 3) : BETA 2 = 2.726 PROBA : 0.74979


Comment faire ce test ?


Puis, on teste si les résidus par modalité puis par bloc sont égaux avec :
ECARTS-TYPES DES RESIDUS
ECARTS-TYPES FACTEUR 1 = F1
1 (F1n1) 2 (F1n2) 3 (F1n3) 4 (F1n4) 5 (F1n5) 6 (F1n6) 7 (F1n7)
3,45 5,9 1,12 5,1 7,17 3,86 3,45
KHI2 = 7.771 PROB =0.25452
ECARTS-TYPES BLOCS = BLOC
1 (b1) 2 (b2) 3 (b3) 4 (b4)
4,59 3,22 3,97 5,38
KHI2 = 1.547 PROB =0.67572


Comment faire ce test ?

Puis j'ai essayé de faire le test de comparaisons des moyennes.
Lorsque je demande une comparaison de moyenne (ANOVA à deux facteurs), Rcmdr écrit :

Code : Tout sélectionner

AnovaModel.2 <- (lm(TonnageParHa ~ Bloc*Modalité, data=Dataset))
Anova(AnovaModel.2)


La deuxième ligne provoque une erreur :

Code : Tout sélectionner

NA/NaN/Inf dans appel à une fonction externe (argument 1)


Si je mets un a minuscule, j'ai (et cela ressemble à ce que je cherche) :

Code : Tout sélectionner

> anova(AnovaModel.2)
Analysis of Variance Table

Response: TonnageParHa
              Df Sum Sq Mean Sq F value Pr(>F)
Bloc           3  74.09   24.70               
Modalité       6 128.90   21.48               
Bloc:Modalité 18 456.71   25.37               
Residuals      0   0.00



mais je n'ai pas les valeurs F value et Pr(>F)...
Pourtant, je les obtiens avec une ANOVA à un facteur, mais pas pour la ligne Bloc:Modalité. Est-ce la valeur du premier test (INTERACTION TRAITEMENTS*BLOCS, SCE test de TUKEY = 24.676 PROBA = 0.340022)

à la fin de cet exemple, on trouve la puissance du test.

comment l'obtenir ?

Il y a encore plein d'essais dans ce rapport, je pense que vos réponses pourraient me mettre sur la voie pour les comprendre.

Merci d'avance pour toutes vos idées, conseils et réponses,
Fabrice Leclercq.

Vincent Chouraki
Messages : 57
Enregistré le : 25 Fév 2008, 12:52

Messagepar Vincent Chouraki » 21 Oct 2010, 15:42

Bonjour,

http://ipsur.r-forge.r-project.org/book/download/IPSUR.pdf

Voir le chapitre 10

Voir aussi les autres manuels disponibles sur le CRAN

http://cran.r-project.org/other-docs.html

Sinon dans R

Code : Tout sélectionner

help.search("test", package="stats")
help.search("test")


HTH
Vincent Chouraki,
Post-Doctorant
Framingham Heart Study, BUSM
Boston, MA

Dominique Soudant
Messages : 758
Enregistré le : 23 Avr 2008, 11:12
Contact :

Messagepar Dominique Soudant » 21 Oct 2010, 15:45


François Bonnot
Messages : 537
Enregistré le : 10 Nov 2004, 15:19
Contact :

Messagepar François Bonnot » 22 Oct 2010, 06:19

Bonjour,
2 éléments de réponse (pas le temps d'aller plus loin)
mais je n'ai pas les valeurs F value et Pr(>F)...

c'est parce que l'interaction n'est pas estimable dans le cas d'un bloc complet équilibré: écrire Bloc+Modalité dans le modèle au lieu de Bloc*Modalité.
Pour l'histogramme des résidus:

Code : Tout sélectionner

hist(AnovaModel.2$res)

FB

Fabrice Leclercq
Messages : 11
Enregistré le : 28 Jan 2010, 22:39

Messagepar Fabrice Leclercq » 25 Oct 2010, 19:23

Bonjour et merci pour ces pistes,

j'avance dans mes recherches et je remplace les tests qui me sont inconnus par d'autres. L'important étant la logique de l'analyse.

R a un test d'égalité des variances (test de Batlett) et en plus, c'est mieux puisque je dis à mes élèves que l'estimation d'un écart type est biaisé, puis un test de normalité (ShapiroWilk), etc...

Par contre, je ne sais pas comment fait StatBox pour tester l'interaction

INTERACTION TRAITEMENTS*BLOCS
SCE test de TUKEY = 24.676 PROBA = 0.340022


Si je pouvais avoir une réponse ou lien vers le test utilisé ici.

Je n'ai pas compris la réponse de François (faute de connaissances théoriques), mais je pense que c'est parce qu'un bloc n'est pas un facteur mais une répétition.

Merci d'avance,
Fabrice Leclercq

François Bonnot
Messages : 537
Enregistré le : 10 Nov 2004, 15:19
Contact :

Messagepar François Bonnot » 26 Oct 2010, 07:03

Je n'ai pas compris la réponse de François (faute de connaissances théoriques), mais je pense que c'est parce qu'un bloc n'est pas un facteur mais une répétition.

Bonjour,
Un bloc est un facteur (presque) comme un autre.
On ne peut pas estimer l'interaction dans le cas d'un essai en b blocs complets de t traitements car les (bt-1) degrés de liberté (ddl) se décomposent en (b-1) pour les blocs, (t-1) pour les traitements et (b-1)(t-1) pour l'interaction. Il ne reste donc aucun ddl pour l'erreur, d'où la nécessité de faire l'hypothèse de non-interaction et d'utiliser ces (b-1)(t-1) ddl pour l'erreur.
Par contre, je ne sais pas comment fait StatBox pour tester l'interaction

Je ne connais pas StatBox mais je suppose que l'interaction est modélisée selon un modèle multiplicatif (1 ddl pour l'interaction et le reste dans l'erreur) et que le test utilisé est connu sous le nom de "Tukey one degree of freedom".
On peut le faire sous R (chercher ces mots-clés sur le site R), mais à mon avis c'est une méthode un peu compliquée pour une première approche de la statistique expérimentale sachant que la notion même d'interaction est parfois difficile à faire passer. Il est plus facile d'introduire cette notion dans le cadre d'un plan factoriel classique avec répétitions, avec ou sans blocs.

FB

Fabrice Leclercq
Messages : 11
Enregistré le : 28 Jan 2010, 22:39

Messagepar Fabrice Leclercq » 30 Oct 2010, 19:44

Bonjour François,

merci pour ces précisions et pour vos conseils,

Je vais en effet rester raisonnable car je n'ai le droit qu'à 4 heures d'enseignement pour l'ANOVA dans une vingtaine d'heures pour parler des tests en partant de zéro à des élèves n'aimant pas particulièrement les maths ;-)

Je regarderai les pistes que vous avez ouvertes pour ma culture personnelle ;-)

cordialement,
Fabrice Leclercq.

Samir Messad
Messages : 76
Enregistré le : 10 Jan 2005, 20:56

Messagepar Samir Messad » 04 Nov 2010, 13:38

Bonjour Fabrice,

pour faire suite à votre dernier message, j'aime beaucoup cette phrase d'Allan Rossman et Beth Chance qui font remarquer que l'apprentissage des statistiques nécessitent de développer des qualités assez différentes de celles utiles aux mathématiques comme notamment l'aptitude à produire des raisonnements dans un cadre d'incertitude :

"Many mathematically strong students will be frustrated, But many less stellar math students will be empowered"

Beth L Chance and Allan J Rossman. INVESTIGATING STATISTICAL CONCEPTS, APPLICATIONS, AND METHODS, first edition,Duxbury Press.

Dominique Soudant
Messages : 758
Enregistré le : 23 Avr 2008, 11:12
Contact :

Messagepar Dominique Soudant » 04 Nov 2010, 15:09



Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité