PLS

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

anne mimet
Messages : 20
Enregistré le : 31 Juil 2007, 08:18

PLS

Messagepar anne mimet » 06 Aoû 2007, 12:27

Bonjour!
Suite aux quelques messages ayant circuler à propos de PLS, je vous soumets mon problème qui semble recouper un déjà soumis il y a qq temps. Je dispose d'un vecteur de présence absence d'une culture sur une parcelle, que je cherche à expliquer par une cinquantaine de variables (et 40 000 parcelles). Après avoir longuement réfléchi sur la méthode à employer il ressort que la regression PLS est surement la solution. J'ai lancé la fonction mrv (test aussi avec plsr). J'obtiens en sortie 50 composantes, toute d'une inertie de 2%. Apparement il y a quelque chose qui ne va pas, mais impossible de mettre le doigt dessus...

Merci de votre aide.
Anne
Anne.

Pierre Bady
Messages : 405
Enregistré le : 02 Mai 2006, 07:46

Messagepar Pierre Bady » 06 Aoû 2007, 13:30

bonjour,

pour les données de type binaires, multinomiales,etc, ...
les fonctions de la librairie "gpls" sont nettement plus adaptées.
(il existe peut-être d'autres library qui couplent glm et pls, à vérifier).
Par contre, pour le diagnostique des modèles, c'est ultra light ...
donc attention!

théoriquement, c'est pas non plus du gâteau :')

lectures indispensables :
http://www.stat.lsu.edu/faculty/marx/IWPLS.pdf
et lire ou relire de la doc sur les glms et la pls de première génération.


@++

Pierre
=@===--------¬-------¬------¬-----¬
liens utiles :
http://www.gnurou.org/Writing/SmartQuestionsFr
http://neogrifter.free.fr/welcomeOnInternet.jpg
]<((((*< -------------------------------

anne mimet
Messages : 20
Enregistré le : 31 Juil 2007, 08:18

Messagepar anne mimet » 07 Aoû 2007, 08:26

Merci Pierre,
j'avais effectivement prévu de faire un glm sur les composantes de sortie de la PLS.
Merci pour tout!
Anne.

Pierre Bady
Messages : 405
Enregistré le : 02 Mai 2006, 07:46

Messagepar Pierre Bady » 07 Aoû 2007, 10:58

bonjour

j'avais effectivement prévu de faire un glm sur les composantes de sortie de la PLS.


c'est pas ce qui était dit dans mon post !

On ne peut/doit pas utiliser directement les composantes de la PLS dans le glm !!!
la "gpls" utilise un algorithme hybridant IWLS et partial least sqaures
(lire : http://www.stat.lsu.edu/faculty/marx/IWPLS.pdf).

donc juste deux petits conseils :

1-SI vous utilisez ces méthodes, faites attention !
théoriquement, c'est complexe ... pratiquement, c'est pas évident à manipuler !
il faut comprendre ce qu'est une pls et un glm, c'est pas nécessairement évident !

2-SI vous ne comprenez pas le fonctionnement des ces méthodes,
utilisez des méthodes plus simples (c'est une règle de base !).
Par exemple, vous pourriez utiliser les premiers axes d'une ACP de vos variables explicatives dans un glm.



en espérant à voir aidé un peu,


Pierre
=@===--------¬-------¬------¬-----¬

liens utiles :

http://www.gnurou.org/Writing/SmartQuestionsFr

http://neogrifter.free.fr/welcomeOnInternet.jpg

]<((((*< -------------------------------

anne mimet
Messages : 20
Enregistré le : 31 Juil 2007, 08:18

Messagepar anne mimet » 07 Aoû 2007, 12:49

Pierre,
Je ne peux pas faire de pls sur les deux premiers axe de l'acp de tableau de variables explicatives car je souhaite obtenir un bon modèle prédictif de ma variable Y. De plus mes variables explicatives sont très corrélées entre elles (c'est ce qui arrive quand on a un tableaux de 40000 individus et 50 variables environnementales, tout est lié, forcément...). En ce qui concerne la méthode dont j'ai parlé précédement, soit la régression logistique sur composantes pls, elle a été décrite par Tenenhaus dans plusieurs papiers, conjointement d'ailleurs à la méthode de régression logistique pls à laquelle vous faites allusion. Il ressort que dans le cas de variables Y binaires les deux méthodes semblent équivalentes.
lien : matisse.univ-paris1.fr/fr/IMG/pdf/ATSAS-Fev06-Tenenhaus-PLS.pdf

(voir les conclusions des dernières pages).
Dans ce document il est bien spécifié que le glm est réalisé sur les composantes de la pls. Manquerait-il une étape dans ces conclusions?

merci.
Anne.

Pierre Bady
Messages : 405
Enregistré le : 02 Mai 2006, 07:46

Messagepar Pierre Bady » 07 Aoû 2007, 13:52

rebonjour,

Je ne peux pas faire de pls sur les deux premiers axe de l'acp de tableau de variables explicatives car je souhaite obtenir un bon modèle prédictif de ma variable Y.


ok, mais vous pouvez faire :
1- une ACP sur les X
2- conserver quelques axes en fonction de la structure des valeurs propres.
3-glm de Y sur les axes sélectionnées.

dans ce cas, il n'y a pas de trace de pls. on est plutôt dans le cadre de la pcr.

Dans ce document il est bien spécifié que le glm est réalisé sur les composantes de la pls. Manquerait-il une étape dans ces conclusions?


ok pour l'algorithme 2 (dans le cadre de variable binaire).

mais, je ne le trouve pas joli.
Je n'aime pas beaucoup le passage "indicatrices de Y" vers "Y binaire utilisé dans un glm"
(enfin,c'est juste mon avis, donc ça vaut ce que ça vaut ...)


en espérant avoir aidé

pierre
=@===--------¬-------¬------¬-----¬

liens utiles :

http://www.gnurou.org/Writing/SmartQuestionsFr

http://neogrifter.free.fr/welcomeOnInternet.jpg

]<((((*< -------------------------------


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité