ACP, AFC puis ACC

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Jérémie LEBRUNET
Messages : 12
Enregistré le : 25 Mai 2007, 11:57

ACP, AFC puis ACC

Messagepar Jérémie LEBRUNET » 26 Mai 2007, 15:14

Bonjour à tous et à toutes ! :D
Je suis tout nouveau sur ce forum et dans le maniement de R.
Dans le cadre de mon stage, je dois traiter des données de végétation sur 8 mares en Camargue.
Il y a 5 relevés en 1997 (mars, avril, juin, juillet et août), 2 relevés en 1998 (mai et juin) et 3 en 1999 (avril, juin et août)

Je dispose d'une matrice de paramètres environnementaux aux valeurs continues (les facteurs d'hydrologie changent à chaque dates mais sont identiques pour chaque mare ; les facteurs pédologiques sont constants dans le temps mais diffèrent entre les mares)
J'ai réalisé des acp (avec le package FactoMineR) avec la fonction PCA : une sur les 3 ans, une pour 97, une pour 98 et une pour 99. C'est satisfaisant mais n'y a-t-il pas un biais puisque les données des 8 mares sont dépendantes temporellement ? ...

Pour la matrice des relevés d'espèces, sauf que les valeurs sont les sommes des classes d'abondance (de 0 à 9) trouvées dans la 10aine ou 20aine de quadrats de chaque mare (elles n'ont pas les mêmes dimensions).
J'ai fait des afc (même package) avec CA : une pour les 3 ans (76 espèces impliquées), une pour 97 (50 sp), une pour 98 (39 sp), une pour 99 (50 sp). Même question, ya-t-il un biais à cause du temps ?

Puis je voudrais réaliser une ACC ou une analyse de co-inertie (faut que je rejette un oeil dans mes cours :? ), mais la seule chose que je voudrais savoir c'est le package nécessaire. On m'a parlé de vegan, qu'en savez-vous ?

Merci d'avance aux gens qui prendront le temps de me répondre, d'ici là je lis le document d'Emmanuel Paradis pour les débutants hihi !

Bonne journée à tous
Jérémie

Nicolas Péru
Messages : 1408
Enregistré le : 07 Aoû 2006, 08:13

Messagepar Nicolas Péru » 27 Mai 2007, 06:50

Salut,

Pour tout ce qui touche aux analyses multivariées j'utilise surtout le package ade4 (adaptation du logiciel du même nom sous R). Vegan est le package pour traiter les données catégorielles.

alors je vais répondre en posant une question mais quel est l'intérêt de faire une analyse séparée pour chaque année ?

Ensuite le choix de la CCA ou de la coinertie va dépendre du rôle que tu veux donner à tes 2 tableaux. La CCA est une analyse deséquilibrée puisqu'elle donne un rôle de prédicteur (généralement le tableau d'environnement) à un tableau et à l'autre un rôle de prédit (le tableau floro-faunistique). La CCA regarde ensuite si on peut voir des corrélations entre variables environnementale et variables faunistiques.
La coinertie met les 2 tableaux au même niveau et va regarder le lien entre ces deux tableaux en donnant une sorte de coefficient de corrélation entre tableau (coefficient RV).
La philosophie n'est donc pas la même. Si tu regardes la biblio tu verras qu'à 90% les personnes ont fait des CCA. Mais le plus souvent ils n'ont pas conscience de faire une distinction entre tableau et interprètent leurs résultats comme s'ils avaient fait une coinertie.

Alors à toi de voir mais pour ma part dans ton cas je ne fais que ds coinertie car je trouve que l'on cherche généralement plus à décrire un lien qu'à décrire un tableau par l'autre...question de choix personnel que je pourrais détailler un peu plus si tu le souhaites ;)

Pierre Bady
Messages : 405
Enregistré le : 02 Mai 2006, 07:46

Messagepar Pierre Bady » 27 Mai 2007, 11:47

bonjour,

pour Nicolas :

Vegan est le package pour traiter les données catégorielles.


désolé Nicolas, mais je ne suis pas vraiment d'accord avec cette remarque (voir la documentation des fonctions cca et rda).

alors je vais répondre en posant une question mais quel est l'intérêt de faire une analyse séparée pour chaque année ?

l'analyse de la stabilité des relations faune-environnement au cours du temps ? ...(cf statico ou le K+N tableau)
mais bon, là, on rentre dans la partie "consulting" :)


Pour Jérémie :

tu peux consulter les documents qui sont sur cette page (Enseignements de Statistique en Biologie de D.Chessel & Co) :
http://pbil.univ-lyon1.fr/R/html/tdr6.html
La co-inertie et les analyses sur variables instrumentales y sont très (très) bien décrites (difficile de trouver mieux :D).
sinon, tu peux aussi faire un tour du coté de l'adelist et de ses archives.


@+

Pierre

qlq références

Thioulouse, J., M. Simier, and D. Chessel. 2003. Simultaneous analysis of a sequence of pairs of ecological tables with the STATICO method. Ecology 85, 272-283.
Dray, S., D. Chessel, and J. Thioulouse. 2003. Co-inertia analysis and the linking of ecological tables. Ecology 84:3078-3089.
=@===--------¬-------¬------¬-----¬
liens utiles :
http://www.gnurou.org/Writing/SmartQuestionsFr
http://neogrifter.free.fr/welcomeOnInternet.jpg
]<((((*< -------------------------------

Nicolas Péru
Messages : 1408
Enregistré le : 07 Aoû 2006, 08:13

Messagepar Nicolas Péru » 27 Mai 2007, 16:01

oui dans vegan il n'y a pas que des analyses pour variables catégorielles.
D'ailleurs je me pose la question de l'intéret des fonctions de ces fonctions dans vegan alors qu'elles existent dans ade4 (ou inversement d'ailleurs...elles sont programmées différemment ?

ok pour la vision k tableau :)...mais ne peut on pas tester une différence inter-annuelle avec une seule CCA puis une analyse between par exemple ?...enfin là encore c'est peut être du consulting :D

P.S : @ Pierre...content de voir que le "michant troll" veille au grain :P

Jérémie LEBRUNET
Messages : 12
Enregistré le : 25 Mai 2007, 11:57

Messagepar Jérémie LEBRUNET » 28 Mai 2007, 09:45

Bonjour à vous, Nicolas et Pierre (michant troll ?! Hihi !)
Effectivement, je pense qu'une CCA est plus appropriée à mon travail : je cherche à pouvoir prédire une composition floristique en fonction des paramètres environnementaux, notamment la pluviométrie.
Je pense que je vais donc télécharger le package ade4. Je taperai donc la commande : Nom.de.l'objet=CCA(x,y,ncp=5) ? Avec x le tableau de variables environnementales et y le tableau de données floristiques, non ?

L'intérêt de faire une afc séparée par année, c'est de voir plus finement ce qui se passe au sein de l'année (97 est très humide, 98 très sèche, 99 intermédiaire). Je pense faire de même avec l'acc : une globale, puis une pour chaque année.

Et au fait, ya pas de biais à faire l'analyse globale avec des données dépendantes temporellement ?

Pierre, merci pour le lien vers les enseignements statistiques en biologie ! :wink:

A bientôt et merci beaucoup de vos réponses !
Jérémie

Marine Cadoret
Messages : 8
Enregistré le : 05 Déc 2006, 14:19

Messagepar Marine Cadoret » 28 Mai 2007, 11:19

Je pense qu'une méthode comme statis ou une AFM pourraientt être intéressantes pour ton analyse (dans Factominer, l'AFM est implémentée) : ce sont justement des analyses de tableaux multiples. Tu considère que chaque année est un tableau avec les mêmes individus, et tu cherches les ressemblances entre tableaux.

Voici un poly qui pourra t'aider à comprendre de quoi il s'agit :
http://www.uhb.fr/sc_sociales/labstats/MEMBRES/PAC/doc/anado.pdf

Pierre Bady
Messages : 405
Enregistré le : 02 Mai 2006, 07:46

Messagepar Pierre Bady » 28 Mai 2007, 11:44

bonjour,

bon, tant pis j'ai trois post de retard ... : (

D'ailleurs je me pose la question de l'intéret des fonctions de ces fonctions dans vegan alors qu'elles existent dans ade4 (ou inversement d'ailleurs...elles sont programmées différemment ?


On va se la péter un peu avec une des devises de Perl :
« There Is More Than One Way To Do It »
« Il existe plus d'une façon de faire »

il me semble que la redondance/diversité est nécessaire …et je me garde bien de porter un jugement sur la nécessité ou pas de telle où telle fonction. Faut rester humble … on fait pas le poids :)

Dans le cas de la cca, les points de vue ne sont pas tout à fait les mêmes (ceci est clairement présenté dans le document de D. Chessel : http://pbil.univ-lyon1.fr/R/fichestd/tdr65.pdf, sinon,il y a aussi les articles de Ter Braak et al & Oksanen et al., Lebreton et al. (1991), Rao (1964), Dray et al. , etc …).

ok pour la vision k tableau :)...mais ne peut on pas tester une différence inter-annuelle avec une seule CCA puis une analyse between par exemple ?...enfin là encore c'est peut être du consulting :D


on peut toujours empiler les analyses sur variables instrumentales ...
on peut aussi faire la CCA en intégrant directement le facteur de la "between" (analyse inter) dans les variables explicatives ... on peut faire plein de chose ...

mais bon, le principal reste de répondre à la question…. sans oublier le principe de parcimonie, d'éviter l'acharnement "thérapeutique" ... et puis si on ne sait pas faire, c’est pas un drame : on lit, on collabore avec un stateux, on consulte un stateux ou on fait quelque chose de plus simple.

je m’excuse pour ce hors-sujet :(


@Jérémie:
Si tu as un peu de mal avec le "2-tableau" ...
Il est préférable de ne pas te lancer corps et âmes dans le "K-tableau" :')

Et au fait, ya pas de biais à faire l'analyse globale avec des données dépendantes temporellement ?


j'aurai tendance à dire si :')
mais bon, prendre cela en compte dans ce type d'analyse n'est (ne doit) pas être nécessairement évident (voir ce qu'il se fait du coté des analyses spatialisées) ... et le jeu en vaut peut-être pas la chandelle (?) ... je ne sais pas. :')


@Marine:
merci pour la documentation :)



@+

Pierre


PS : une question par topic, svp :p
=@===--------¬-------¬------¬-----¬

liens utiles :

http://www.gnurou.org/Writing/SmartQuestionsFr

http://neogrifter.free.fr/welcomeOnInternet.jpg

]<((((*< -------------------------------

Nicolas Péru
Messages : 1408
Enregistré le : 07 Aoû 2006, 08:13

Messagepar Nicolas Péru » 28 Mai 2007, 12:13

il me semble que la redondance/diversité est nécessaire …et je me garde bien de porter un jugement sur la nécessité ou pas de telle où telle fonction. Faut rester humble … on fait pas le poids :)


Pierre...encore michant troll !! :)

oui pour la redondance et les différentes manière de procéder...et oui je reste humble...je voulais simplement savoir lorsqu'on utilise les deux est ce qu'on peut obtenir des choses différentes et/où complémentaires :)

PS : une question par topic, svp :p


mais non quand on arrive à te faire sortir de ton monde parallèle autant en profiter :D....bon d'accord je sors pour cause de flood :)

@+

Pierre Bady
Messages : 405
Enregistré le : 02 Mai 2006, 07:46

Messagepar Pierre Bady » 28 Mai 2007, 12:18

rebonjour,



mais non quand on arrive à te faire sortir de ton monde parallèle autant en profiter :D...

il y a les mails ou les mp :)

pour l'implémentation des cca, acpvi, rda ... on retombe sur nos pattes.

@+

Pierre

PS : avec ce flood, on est à 2 doigts du ban :')
=@===--------¬-------¬------¬-----¬

liens utiles :

http://www.gnurou.org/Writing/SmartQuestionsFr

http://neogrifter.free.fr/welcomeOnInternet.jpg

]<((((*< -------------------------------

Jérémie LEBRUNET
Messages : 12
Enregistré le : 25 Mai 2007, 11:57

Messagepar Jérémie LEBRUNET » 28 Mai 2007, 13:43

Merci beaucoup de vos réponses, et de vos charmants échanges Pierre et Nicolas ! :wink:
Je crois que pour le biais temporel, je vais laisser tomber dans l'immédiat... J'ai beaucoup à faire... Et les analyses spatialisées ça me paraît assez obscur... :?
Par contre, j'ai un souci, pour télécharger ade4, voilà le message d'erreur :
" essai de l'URL
'http://cran.univ-lyon1.fr/bin/windows/contrib/2.5/ade4_1.4-3.zip'
Error in download.file(url, destfile, method, mode = "wb") :
impossible d'ouvrir l'URL 'http://cran.univ-lyon1.fr/bin/windows/contrib/2.5/ade4_1.4-3.zip'
De plus : Warning message:
ouverture impossible : le statut HTTP était '0 (nil)'
Avis dans download.packages(p0, destdir = tmpd, available = available, : download of package 'ade4' failed "

J'ai téléchargé vegan, mais quand je tape "?CCA"
il me dit qu'il n'ya pas de documentation disponible...

Je suis nul ou ça déconne ? :?:

Merci d'avance, et de la coopération de ce forum
Jérémie

E.H. [compte supprimé]

Messagepar E.H. [compte supprimé] » 28 Mai 2007, 15:03

Pour le téléchargement corrompu, essaye à partir d'une autre serveur (?).

Pour la fonction CCA du package vegan, il faut que tu le charges avant je pense. Pour ma pars je charge les packages installés supplémentaires via le menu : Packages> charger le package> vegan

ensuite seulement tu auras acces aux fichiers d'aide des fonctions du package.

enfin, peut être je me plante complètement...

Nicolas Péru
Messages : 1408
Enregistré le : 07 Aoû 2006, 08:13

Messagepar Nicolas Péru » 28 Mai 2007, 15:09

mais non tu n'es pas nul...d'ailleurs avec R on est jamais nul, on apprend :D (c'set pour me rassurer moi même :D)

as tu chargé la librairie dans ton espace de travail avec la commande

library(vegan)


?
...

je m'arrête là car je constate qu'emmanuel a posté en même temps que moi :)

Jérémie LEBRUNET
Messages : 12
Enregistré le : 25 Mai 2007, 11:57

Messagepar Jérémie LEBRUNET » 29 Mai 2007, 16:05

Hihi ! Effectivement, il suffisait de taper library(vegan) pour avoir accès à la doc ! J'apprends !
Pour télécharger ade4, je vais essayer directement sur le site où j'avais télécharger R. Sinon, il y a aussi dans la liste des packages à télécharger ade4TkGUI. C'est quoi ? C'est pas juste une autre version du package ade4 ?
Bref, je vais déjà bosser un peu avec vegan !
Merci beaucoup et à bientôt ! :)

Véronique Sarrot
Messages : 7
Enregistré le : 09 Sep 2008, 10:10

Messagepar Véronique Sarrot » 01 Déc 2008, 14:22

bonjour !

j'aimerais appliquer les méthodes de K-tableaux (statis ou analyse séparée, je sais pas très bien encore), mais j'ai du mal à trouver de la documentation à ce sujet. Je voudrais bien lire celle proposée par Marine, mais lien ne fonctionne plus !!
Pourrais-je avoir un lien actualisé, et connaissez-vous d'autres doc ? (j'ai déjà lu bien sûr celle de l'université de Lyon !)

merci à tous

Pierre Bady
Messages : 405
Enregistré le : 02 Mai 2006, 07:46

Messagepar Pierre Bady » 01 Déc 2008, 15:38

bonjour,


pour statis:

L'Hermier des Plantes, H. (1976) Structuration des tableaux à trois indices de la statistique. Théorie et applications d'une méthode d'analyse conjointe. Thèse de 3° cycle, USTL, Montpellier.

Escoufier, Y. (1987a). Three-mode data analysis: the STATIS method. In Methods for multidimensional data analysis, pp. 325-38. ECAS.

Lavit, C., Escoufier, Y., Sabatier, R. & Traissac, P. (1994) The ACT (STATIS method). Computational Statistics & Data Analysis, 18(1), 97-119.

Lavit, C (1988) Analyse conjointe de Tableaux Quantitatifs, Dunod.

etc ...


les travaux de Escoffier B. et Pagès J. pour ce qui touchent à l'AFM:

Escofier, B. & Pages, J. (1994) Multiple factor analysis (AFMULT package). Computational Statistics & Data Analysis, 18(1), 121-40.

Escofier, B. & Pagès, J. (1998). Analyses factorielles simples et multiples : Objectifs, méthodes et interprétation (3e édition). In, p 284. Dunod, Paris.


etc ...



pour la GPA:

Gower, J.C. (1975) Generalized procustes analysis. Psychometrika, 40, 33-51.

Guerrero, L., Romero, A. & Tous, J. (2001) Importance of Generalised Procustes Analysis in sensory characterisation of virgin olive oil. Food Quality and Preference, 12, 515-20.

Meyners, M., Kunert, J. & Qannari, E. (2000) Comparing generalized procustes analysis and statis. Food Quality and Preference, 11, 77-83.

ten Berge, J.M.F. (1977) Orthogonal Procustes rotation for two or more matrices. Psychometrika, 42, 267-76.

etc ...


pour les analyses "three-mode" :
http://three-mode.leidenuniv.nl/



bon, j'arrête ici ... pour le reste => STFW



@+



pierre
=@===--------¬-------¬------¬-----¬

liens utiles :

http://www.gnurou.org/Writing/SmartQuestionsFr

http://neogrifter.free.fr/welcomeOnInternet.jpg

]<((((*< -------------------------------


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Google [Bot] et 1 invité