intégration de var explicatives dans une régression multiple

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Cadet serge
Messages : 4
Enregistré le : 17 Juil 2008, 09:50

intégration de var explicatives dans une régression multiple

Messagepar Cadet serge » 17 Juil 2008, 10:20

Bonjour,

J'ai caractérisé grâce à une ANCOVA et une analyse discriminante les variables ayant une influence significative sur l'accroissement radial du hêtre. Finalement, je sais que mes 5 variables expliquent respectivement un certain pourcentage de cet accroissement.

Cependant, mon but est de prédire cet accroissement en fonction des variables. comment puis-je agréger ma régression linéaire et mes contributions afin d'augmenter la qualité de ma prédiction??????


Merci beaucoup... :P :P [/b]

guillaume malherbe
Messages : 3
Enregistré le : 26 Mai 2008, 13:43

Messagepar guillaume malherbe » 22 Juil 2008, 13:02

La fonction lm permet de coupler variables quantitatives et qualitatives. Il suffit ensuite d'utiliser la fonction predict sur ton nouveau jeu de données.

Attention:bien définir les variables qualitatives en tant que facteurs.

En espérant avoir répondu à ta question.
Guillaume Malherbe

Cadet serge
Messages : 4
Enregistré le : 17 Juil 2008, 09:50

Messagepar Cadet serge » 24 Juil 2008, 14:16

En fait J'ai une régression linéaire (Age~Circonférence) de qualité (r) mais une prédiction mauvaise (40ans d'erreur à 95% de certitude).
pour comprendre cette variance et la diminuer ensuite, j'ai réalisée une analyse discriminante qui caractérise l'influence de mes variables environnementales sur l'accroissement radial (en fait la productivité surface terrière/Age) de mes arbres.
j'ai obtenu mes contributions (en %) des variables sur cette productivité et ma courbe de "productivité" générée est en fait une parabole.
Mon problème est d'intégrer les variables environnementales (% explication de productivité) dans mon modèle de prédiction de l'age afin de réduire l'intervalle de ma prédiction?

finalement je voudrait quand disant à l'ordi, que pour telle densité, telle exposition, telle altitude.... et en lui donnant une circonférence, qu'il mouline et me dise il a tel âge avec telle précition. Je suis complètement perdu là...

Je ne sais pas si j'ai été très clair...
Mais je te remerci

guillaume malherbe
Messages : 3
Enregistré le : 26 Mai 2008, 13:43

Messagepar guillaume malherbe » 24 Juil 2008, 15:03

Ta variable réponse est l'age de l'arbre, c'est donc une variable quantitative. Je ne vois pas trop l'intérêt de la considérée comme qualitative si c'est ce que tu fais dans l'analyse discriminante.
Pourquoi ne pas intégrer l'ensemble de tes variables, qualitatives ou non dans ton modèle de régression?
Concernant les qualités prédictives de ton modèle, as-tu vérifiés les hypothèses de la régression au préalable. Il se pourrait que les variables explicatives soient très corrélées entre elles par exemple.

Je ne vois pas trop comment t'aider à part cela, désolé.
Guillaume Malherbe

Cadet serge
Messages : 4
Enregistré le : 17 Juil 2008, 09:50

Messagepar Cadet serge » 24 Juil 2008, 15:31

Les hypothèses de régressions sont bien respectées et les variables explicatives corrélées entre elles (redondantes) ont été éliminées.
Mais ma régression, dans l'état actuel des choses n'articule que l'age et la circonférence. Je ne sait pas comment intégrer l'ensemble de mes variables dans la régression....
l'analyse discriminante ne m'a servi qu'à savoir comment se comportées les variables explicatives (environnementales) envers la productivitée (rapport surface terrière/Age) qualifiée de "faible", "moyenne", "forte" et très "forte", et de savoir quel été leur taux de contribution.. Je n'ai pas mis la variable age dans l'A Discriminante.

Renaud Lancelot
Messages : 2484
Enregistré le : 16 Déc 2004, 08:01
Contact :

Messagepar Renaud Lancelot » 24 Juil 2008, 16:21

Je ne connais rien à ce pb particulier, mais il me semble surprenant que la relation age = f(diametre) soit directement linéaire (sans transfomation). Est-ce que la forme du nuage de points est compatible avec une droite de régression de la forme age = b_0 + b1 * diamètre ?

Par ailleurs si vous êtes dans une approche prédictive, la solution qui me semble la plus naturelle serait d'inclure toutes les variables pertinentes et biologiquement plausibles dans le modèle, et ensuite d'utiliser une méthode de sélection de variable appropriée, comme l'AIC ou le BIC, par exemple.

Sur un plan pratique c'est simple à faire à parti du moment où toutes les variables sont dans le même data.frame.

Renaud

Cadet serge
Messages : 4
Enregistré le : 17 Juil 2008, 09:50

Messagepar Cadet serge » 28 Juil 2008, 11:34

bonjour,
Je pense que je vais me pencher sur la question de l'AIC, car je n'arrive pas à résoudre mon problème de la manière dont je l'entendais. Le problème est que je ne l'ai jamais utilisé sur R.

J'avais omis le fait que la circonférence est forcée en log 10.
Merci encore pour vos conseils.

Serge


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité