sic de metomet - vs - extract AIC

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

E.H. [compte supprimé]

sic de metomet - vs - extract AIC

Messagepar E.H. [compte supprimé] » 04 Juil 2007, 22:31

Bonjour tout le monde,

mon avant dernière intervention sur ce forum... Je m'excuse d'avance pour la longueur du message. J'espère que quelqu'un aura le courage de me lire jusqu'au bout et acceptera de tenter de répondre à toutes (ou partie de) ces interrogations. C'est la dernière fois que je vous embete, promis !

--------------------

je reviens sur plusieurs de mes topics sur ce forum, en raison d'un véritable soucis. je pense que mes 6 mois de travail sont plantés (?). soit, tant pis, de toute facon je doit rendre mon mémoire dans 5 jours... mais je cherche à le confirmer dans l'objectif de pouvoir expliquer l'erreur de mes résultats lors de ma soutenance, si erreur il y a. peut être y'a t il une explication rationnelle et que mes résultat ne sont finalement pas faux, mais il faut que je comprenne ce qui m'echappe.

j'ai des modèles linéaires du type lm, sur lesquels je réalise des anova --> anova(lm(....)) qui revient au même que aov(...) de ce que j'ai compris de l'aide de R concernant les différentes fonctions, notamment ceci :
Fit an analysis of variance model by a call to lm for each stratum


compte tenu du grand nombre de variables explicatives, je selectionne le meilleur modèle avec le critère AIC, afin de reduire le risque alpha de declarer un effet significatif juste par le hasard. mon directeur de mémoire m'avait dès le départ orienté sur la fonction extractAIC() afin de récupérer l'AIC des modèles

---------------------

exemple de résultat sur un modèle de classe lm, où co est une variable à 6 niveaux :

Code : Tout sélectionner

> extractAIC(aov(ASRF3~co, data=fcb))
[1]    6.0000 -316.6329


ou 6.000 représente "the number of free parameters for usual parametric models" soit le nombre de paramètres du modèle (?je me trompe pas?)

a tord peut etre, j'ai finalement décidé d'utiliser la fonction sic du package metomet... qui me permettait de recupérer en plus de l'aic, l'aicc, snas avoir à reprogrammer une fonction spécifique ou avoir a faire les calculs de l'aicc a la main

Code : Tout sélectionner

> sic.aov(aov(ASRF3~co, data=fcb))
                              n k      nsk        LL      AIC     AICc      BIC
aov(ASRF3 ~ co, data = fcb) 226 7 32.28571 -156.3637 326.7274 327.2411 350.6711


ici, le nombre de paramètres du modèle, si je ne me trompe pas, est k = 7.

Pour extractAIC,
voici la description :
This is a generic function, with methods in base R for "aov", "coxph", "glm", "lm", "negbin" and "survreg" classes.
The criterion used is

AIC = - 2*log L + k * edf,

where L is the likelihood and edf the equivalent degrees of freedom (i.e., the number of free parameters for usual parametric models) of fit.
For linear models with unknown scale (i.e., for lm and aov), -2log L is computed from the deviance and uses a different additive constant to logLik and hence AIC.


au contraire, la fonction sic()du package metomet, utilise la même méthode de calcul que la fonction AIC(), au vu des résultats identiques de la valeur de l'AIC

Code : Tout sélectionner

> AIC(aov(ASRF3~co, data=fcb))
[1] 326.7274


et voici la descr. que l'on trouve pour AIC :
The default method for AIC, AIC.default() entirely relies on the existence of a logLik method computing the log-likelihood for the given class.
When comparing fitted objects, the smaller the AIC, the better the fit.
The log-likelihood and hence the AIC is only defined up to an additive constant. Different constants have conventionally be used for different purposes and so extractAIC and AIC may give different values (and do for models of class "lm": see the help for extractAIC).

Je ne saisi pas bien l'explication et quelle différence reelle il y a entre les deux méthodes. mon bagage statistique semble trop limité.

--------------------

--->> Concretement, j'ai basé tous mes résultats sur les resultats de la fonction sic. dans ma situation, etait ce un bon choix ?

--------------------

pourquoi le nombre de paramètres du modèle est différent selon les méthodes ? Je n'arrive pas à comprendre ou se trouve la différence entre les deux fonctions qui aboutit à des modèles différents !
la différence d'aic entre deux modèle serait t elle strictement identique avec les deux méthodes ? c'est a dire, avec les deux méthodes, est ce que je sélectionnerait au final le meme modèle ?

Je serais on ne peut plus reconnaissant envers celui qui me permettra de comprendre erreur, si erreur il y a, afin de m'aider dans la construction de ma soutenance et justifier mes résultats.

--------------------

Je cite renaud ( viewtopic.php?t=446 ) :
Sauf erreur de ma part, il y a bien deux paramètres estimés: la moyenne générale et la variance résiduelle ==> k = 2. Dans un modèle gaussien, la moyenne et la variance sont en effet indépendantes (différent d'un modèle binomial ou de Poisson, par exemple).

Or, le pdf dont j'ai fait référence dans mon message précédent indique que k (dans la formule AIC=-2Log(vraisemblance) + 2k) est le nombre de parametres du modèle estimé, et il inclue intercept et variance residuelle uniquement dans le cas ou la méthode d'estimation se fait selon les moindres carrés, car dans cette situation :
AIC =n(log(variance²)) + 2K.
ce qui n'est pas ma situation je crois...


dans ma situation, un modèle nul (aucune variable étudiée n'intervient sur la réponse) : y = b0 (ou b0 est l'intercept)
n'a qu'un seul paramètre.

etant donné que je n'utilise pas la méthode des moindres carrés, j'ai bien un unique paramètre dans le cas d'un modèle nul.

pourquoi la fonction sic me donne alors 2 paramètres dans le cas d'un modèle de classe lm nul ? lorsque la fonction extractAIC me donne 1 paramètre pour un même modèle nul?

--------------------

pourquoi n'ai je pas ce probleme dans le cas d'une classe glm :

Code : Tout sélectionner

> extractAIC(glm(a3~1, family=binomial, data=scb))
[1]    1.000 3495.365
> sic.glm(glm(a3~1, family=binomial, data=scb))
                                              n k  nsk        LL      AIC     AICc      BIC
glm(a3 ~ 1, family = binomial, data = scb) 2618 1 2618 -1746.682 3495.365 3495.366 3501.235


--------------------

Voilà, pour ma dernière question sur ce forum... je remercie d'avance ceux qui accepteront de me donner quelques explications, quelques pistes de réflexion qui me permettront de construire un argumentaire face à mes résultats et mes choix de méthode

FlopG

FlopG

Messagepar FlopG » 05 Juil 2007, 07:21

.edité

Renaud Lancelot
Messages : 2484
Enregistré le : 16 Déc 2004, 08:01
Contact :

Re: sic de metomet - vs - extract AIC

Messagepar Renaud Lancelot » 05 Juil 2007, 09:14

Emmanuel Henke a écrit :Je cite renaud ( viewtopic.php?t=446 ) :
Sauf erreur de ma part, il y a bien deux paramètres estimés: la moyenne générale et la variance résiduelle ==> k = 2. Dans un modèle gaussien, la moyenne et la variance sont en effet indépendantes (différent d'un modèle binomial ou de Poisson, par exemple).

Or, le pdf dont j'ai fait référence dans mon message précédent indique que k (dans la formule AIC=-2Log(vraisemblance) + 2k) est le nombre de parametres du modèle estimé, et il inclue intercept et variance residuelle uniquement dans le cas ou la méthode d'estimation se fait selon les moindres carrés, car dans cette situation :
AIC =n(log(variance²)) + 2K.
ce qui n'est pas ma situation je crois...


dans ma situation, un modèle nul (aucune variable étudiée n'intervient sur la réponse) : y = b0 (ou b0 est l'intercept)
n'a qu'un seul paramètre.

etant donné que je n'utilise pas la méthode des moindres carrés, j'ai bien un unique paramètre dans le cas d'un modèle nul.

pourquoi la fonction sic me donne alors 2 paramètres dans le cas d'un modèle de classe lm nul ? lorsque la fonction extractAIC me donne 1 paramètre pour un même modèle nul?

--------------------

pourquoi n'ai je pas ce probleme dans le cas d'une classe glm :

Code : Tout sélectionner

> extractAIC(glm(a3~1, family=binomial, data=scb))
[1]    1.000 3495.365
> sic.glm(glm(a3~1, family=binomial, data=scb))
                                              n k  nsk        LL      AIC     AICc      BIC
glm(a3 ~ 1, family = binomial, data = scb) 2618 1 2618 -1746.682 3495.365 3495.366 3501.235



Votre post est beaucoup trop long...

Je n'ai pas parlé de méthode des moindres carrés versus autre méthode, mais de lois de probabilité sous-jacentes aux modèles. Le point crucial est de vous assurer que la méthode d'estimation utilisée fournit des estimateurs du maximum de vraisemblance, ce qui est bien le cas avec lm, aov et glm.

Dans le cas d'une loi normale (modèle gaussien), il y a deux paramètres à estimer: moyenne et variance. Dans un modèle binomial ou de Poisson, il n'y en a qu'un seul: la moyenne. Et cela quel que soit le nombre de covariables et de coefficients correspondants à estimer. En clair, si vous utilisez un modèle gaussien pour estimer k coefficients (effets fixes hors intercept), vous aurez k + 2 paramètres intervenant dans le calcul d' AIC: 1 pour l'intercept, k pour les coefficients, 1 pour la variance résiduelle. Avec un modèle binomial ou de Poisson, vous n'en aurez que k + 1 car la variance est alors une fonction de la moyenne, d'après le modèle. Dans le cas particulier d'un modèle sans covariable (modèle de la moyenne générale), vous aurez 2 paramètres à estimer avec un modèle gaussien (moyenne et variance résiduelle) et un seul avec un modèle binomial ou de Poisson.

D'autre part, d'une manière générale, je vous déconseille VIVEMENT de ne pas utiliser explicitement les méthodes spécifiques mais de toujours faire appel à la fonction générique: cela peut être cuisant si si l'on n'y prend pas garde. En clair, utiliser sic et non pas sic.glm.

Renaud

E.H. [compte supprimé]

Messagepar E.H. [compte supprimé] » 05 Juil 2007, 11:52

Bonjour
Merci pour vos réponses.
E.V. Dennst :
Votre post a le mérite d'une rare franchise. Merci
Je réagis simplement car votre post me semble très représentatif de l'état d'esprit de très nombreux stagiaires/étudiants du forum.
Je ne discute pas technique ... car votre problème n'est pas là.


Je vous en prie, je n'ai aucunement la prétention de dire que je suis statisticien, et j'ai l'humilité de reconnaitre que je suis loin d'avoir réponse à tout.
J'ai essayé de répondre en partie, comme vous l'avez bien souligné, à une question qui était posée, tant bien que mal. Il est évident que mon bagage stat n'est pas assez poussé, ces six mois m'ont permis de l'améliorer un peu, en six mois j'aurais eu le temps de lire un certain nombre de publi sur les méthodes utilisées... mais j'ai remarqué que bien souvent les auteurs arbordent de différentes facons et finalement "embrouilllent" les idées de quelqu'un qui essaie de comprendre par lui même.

Tout le monde n'a pas la chance d'avoir un statisticien derrière lui pour lui donner les ressources adéquates, dans ce cas on cherche seul, peut etre dans la mauvaise direction... parfois on se plante. le tout c'est de le savoir et de le reconnaitre. c'est mon cas aujourd'hui.

on m'a dit au début de mon stage, applique telle méthode, c'est ce qu'on utilise. je l'ai fait. mais j'ai essayé de ne pas le faire bêtement et de rentrer dans le détail, essayer de comprendre ce que je faisais. la théorie est vaste, j'y suis confronté de plein fouet, et effectivement, en conclusion de ce stage, pour répondre à :
A part une augmentation de leur incompréhension, je me demande ce que les stagiaires extraient (à titre perso) de leurs stages

j'ai une vision assez négative du monde de la recherche... j'ai été confronté a de grande difficultés sur le traitement de mes données, qui sont des données similaires à d'autres (même thématique, ême procédé de relevé, etc...) et qui eux, semble t il ont de très bons résultats avec les méthodes que j'ai moi meme essayé de mettre en place. Je me pose la quesiton suivante :
combien d'approximations ont ils fait pour arriver a ce résultat ? leur publis sont belles, résultats clair... j'aimerais bien voir la gueule de leurs données à la base et savoir combien de concessions ils ont fait... il n'y a aucune raison que leurs données, sur la même thématique, dans des conditions semblables, soient à ce point différentes de celles que j'avais à traiter. et pourtant, les résultats sont publiés et d'autres chercheurs se basent sur leur travaux... une boucle sans fin, je fais des approximations, je publie, le suivant recommence sur la base du précédent... ou va t on ?

----

Pour répondre à Renaud,

en effet, vous ne m'avez pas parlé de méthode des moindres carrés. Ma remarque faisait suite à la lecture du pdf de Burnham dans le post en question... j'ai lu, j'ai essayé ed comprendre... et c'est ce que j'avais ocmpris. c'est écrit noir sur blanc. mon interprétation est apparemment erronée.
Votre réponse me convient, je ne la met pas en doute, je mettais juste en confrontation deux des arguments lus qui ne concordent pas de ce que personnelement j'en ai compris. apparement, je n'en ai rien compris. je l'avoue




--------------------------

Je ne vous embete plus avec mes question de newbies, j'ai bien compris que je n'avais rien à faire sur un forum comme celui ci, consacré à des personnes hautement qualifiées pour qui tout coule de source. Je vous laisse donc, je vous remercie pour le temps que vous aurez pu m'accorder. Vous m'aurez été d'une aide non négligeable.



C'est le devoir de chaque homme de rendre au monde au moins autant qu'il en a reçu. A. Einstein.




n'ayant pas d'autre moyen de le faire que celui ci :



Merci à tous.

Renaud Lancelot
Messages : 2484
Enregistré le : 16 Déc 2004, 08:01
Contact :

Messagepar Renaud Lancelot » 05 Juil 2007, 12:38

Emmanuel Henke a écrit :en effet, vous ne m'avez pas parlé de méthode des moindres carrés. Ma remarque faisait suite à la lecture du pdf de Burnham dans le post en question... j'ai lu, j'ai essayé ed comprendre... et c'est ce que j'avais ocmpris. c'est écrit noir sur blanc. mon interprétation est apparemment erronée.


Dans le cas d'un modèle linéaire, la méthode des moindres carrés fournit une estimation du maximum de vraisemblance, ce qui explique ce qui "est écrit noir sur blanc". C'est un résultat dont vous trouverez la démonstration dans tout bon bouquin sur le modèle linéaire et c'est un exemple souvent repris pour expliquer le calcul de la vraisemblance.

Renaud

Héléna Castermant
Messages : 39
Enregistré le : 08 Juin 2007, 07:40

Messagepar Héléna Castermant » 05 Juil 2007, 14:00

Bonjour à tous,

Cela m'attriste beaucoup Emmanuel pour ta soutenance...
Je comprends ce que c'est de galérer, je suis actuellement en stage et beaucoup de difficultés se présentent à moi, et pas seulement statistique.
Je pense notamment au manque de données que j'ai, ou des données fausses.
En tout cas, je ne comprends pas pourquoi tu ne veux plus venir sur le forum... Tu n'auras plus jamais besoin de R?

Personnellement, je connais R que depuis quelques mois, je suis consciente de n'être qu'une débutante, mais j'apprends petit à petit...On ne peut pas maîtriser un tel logiciel en peu de temps, d'autant plus que oui il y a la théorie statistique à connaître.

En tout cas, pour ma part, le stage m'aura appris à connaître le monde professionnel, à travailler seule (car pas de statisticiens avec moi) et à connaître un peu mieux le logiciel R. Je suis encore loin de le maîtriser mais ces derniers mois, j'ai appris énormément et notamment grâce à ce forum, où les gens ont eu la gentillesse de me répondre. J'espère que ce forum perdurera encore longtemps pour que les débutants de R et les plus experts continuent à communiquer et à s'entraider.

E.H. [compte supprimé]

Messagepar E.H. [compte supprimé] » 05 Juil 2007, 14:21

Re,

Cela m'attriste beaucoup Emmanuel pour ta soutenance...
merci de la compassion... je fais valider demain mon rapport par mon directeur, il risque d'y avoir de mauvaises surprises :-) mais bon, dans 15 jours j'aurais soutenu, je pourrais faire un break, je n'ai plus les idées très claires sur le sujet.

En tout cas, je ne comprends pas pourquoi tu ne veux plus venir sur le forum... Tu n'auras plus jamais besoin de R?
tout simplement car je me rend compte que je n'ai rien à faire dans le milieu de la recherche "fondamentale", et à moins d'avoir une opportunité d'emploi dans ce domaine (je ne cracherais pas dessus, il faut bien vivre), je chercherais un job plus "terre à terre" et laisserais ces aspects stats à ceux dont c'est "le délire". Pour ma part, je suis un peu "dégouté". Mais c'est bien, ca m'aura permis de me mettre les idées au clair sur ce que je ne souhaites pas faire de ma vie. j'ai pas trouvé ce que je veux faire, mais je sais ce vers quoi je ne souhaites pas aller.

En tout cas, pour ma part, le stage m'aura appris à connaître le monde professionnel, à travailler seule (car pas de statisticiens avec moi) et à connaître un peu mieux le logiciel R. Je suis encore loin de le maîtriser mais ces derniers mois, j'ai appris énormément et notamment grâce à ce forum, où les gens ont eu la gentillesse de me répondre.

Pour ma part:
Connaitre le monde professionnel, j'en avais eune petite expérience, mais celle ci est difficile... 6 mois de stage... seul à traiter des données, pas terrible comme immersion professionnelle. Travailler seul, cela allait donc de pair... Connaitre un peu mieux le logiciel R, certes, mais trop complexe pour moi... --> retour sur la théorie des stats, je me rends compte que ca ne m'interesse pas plus que ca de me prendre la tête pour des broutilles. quel test, quelles conditions d'application, comment mettre en oeuvre, etc... en clair, je ne suis pas fait pour ça. tant mieux que certains soient pationnés par cela, il en faut pour avancer, mais je prefere être "le larbin" qui collecte les données que celui qui les traite. certes, pour la collecte il faut avoir une idée de comment l'on traite les données ensuite (indispensable pour réduire les erreurs utltérieures), mais sérieusement, pffff... j'en trouve plus les mots.

J'espère que ce forum perdurera encore longtemps pour que les débutants de R et les plus experts continuent à communiquer et à s'entraider.

je n'en penses pas moins...
bonne continuation à vous... mais une fois ce stage fini, je ne reviendrais que si un emploi m'y oblige et si je n'ai d'autre solution que cette roue de secours.

Au plaisir de vous lire.

E.H. [compte supprimé]

Messagepar E.H. [compte supprimé] » 05 Juil 2007, 15:00

Re,
une dernière remarque qui justifiait ma question initiale également.

Selection de modèle par aic --> possibilité d'utiliser la fonction step, basée sur une théorie solide. je n'invente rien, je refère à ce fil de discussion : viewtopic.php?t=354&highlight=
et la méthodologie utilisée par step et plus "solide" qu'une méthode en pas a pas classique.

et je refere à l'aide de R
step uses add1 and drop1 repeatedly; it will work for any method for which they work, and that is determined by having a valid method for extractAIC.

or je reviens sur le fait que extractAIC me donne nombre de param pour un modele nul = 1, et sic donne nb param = 2... pour une classe aov. il y a donc bien un élément théorique derriere qui amène cela. et c'est cela que je cherche à saisir.

et l'on constate de fait que la valeur de l'AIC n'est pas egale dans les deux cas. pourtant, on le calcul de l'AIC n'a pas foultitude de manieres de procéder.

Comprenez vous mes interogations ? ok, il y a la théorie derriere... sans doute les deux ne refèrent pas à la même chose. ce n'est pas faute d'avoir cherché à comprendre, de ne pas avoir lu de publis sur la question. ok mon bagage stats est loin d'être parfait. mais les faits sont là, je n'arrive pas à comprendre.

enfin bref.... zourp.

Héléna Castermant
Messages : 39
Enregistré le : 08 Juin 2007, 07:40

Messagepar Héléna Castermant » 05 Juil 2007, 19:12

Re,

Je comprends que tu puisses ne pas vouloir te pencher davantage dans l'avenir dans la théorie statistique. Il est vrai que tout cela est difficile et je suis loin de tout connaître. Pour preuve, pour tes questions, je suis désolée, je suis incapable de te répondre...Je sais que c'est frustrant et énervant quand on ne comprend pas, et ce bien que l'on ait cherché. Désolée de ne pas pouvoir répondre.
Bon courage pour la suite en tout cas et j'espère que tu trouveras un métier qui te convient !

Renaud Lancelot
Messages : 2484
Enregistré le : 16 Déc 2004, 08:01
Contact :

Messagepar Renaud Lancelot » 06 Juil 2007, 09:33

Emmanuel Henke a écrit :et je refere à l'aide de R
step uses add1 and drop1 repeatedly; it will work for any method for which they work, and that is determined by having a valid method for extractAIC.

or je reviens sur le fait que extractAIC me donne nombre de param pour un modele nul = 1, et sic donne nb param = 2... pour une classe aov. il y a donc bien un élément théorique derriere qui amène cela. et c'est cela que je cherche à saisir.

et l'on constate de fait que la valeur de l'AIC n'est pas egale dans les deux cas. pourtant, on le calcul de l'AIC n'a pas foultitude de manieres de procéder.


Le pb vient du fait que extractAIC n'est pas une fonction faite pour être appelée directement par les utilisateurs non spécialistes. Il est préférable pour ces derniers d'utiliser les fonctions génériques comme AIC, BIC (voire sic) plutôt que les fonctions comme extractAIC, faites pour faciliter le travail des programmeurs comprenant les détails des méthodes statistiques sous-jacentes.

Code : Tout sélectionner

> y <- runif(10)
> x <- factor(sample(c("a", "b"), size = 10, replace = TRUE))
> m1 <- aov(y ~ 1)
> m2 <- aov(y ~ x)
>
> library(metomet)
Package metomet, version 0.6-5
> library(nlme)
>
> sic(m1, m2)
    n k        LL      AIC     AICc      BIC
m1 10 2 0.7735506 2.452899 4.167185 3.058069
m2 10 3 0.7853413 4.429317 8.429317 5.337073
> AIC(m1, m2)
   df      AIC
m1  2 2.452899
m2  3 4.429317
> BIC(m1, m2)
   df      BIC
m1  2 3.058069
m2  3 5.337073


Renaud

E.H. [compte supprimé]

Messagepar E.H. [compte supprimé] » 06 Juil 2007, 11:40

Bonjour

Renaud Lancelot a écrit :Le pb vient du fait que extractAIC n'est pas une fonction faite pour être appelée directement par les utilisateurs non spécialistes. Il est préférable pour ces derniers d'utiliser les fonctions génériques comme AIC, BIC (voire sic) plutôt que les fonctions comme extractAIC, faites pour faciliter le travail des programmeurs comprenant les détails des méthodes statistiques sous-jacentes.


certainement, mais cela ne me donne pas d'explication sur la différence obtenue, cela ne fait que confirmer mon newbie'isme... quelle sont ces méthodes stats relatives a extractAIC que vous citez ?
je doit referer a l'unique ouvrage cité dans l'aide de la fonction pour savoir comment elle fonctionne dans le détail ?

je reste dans la volonté de comprendre... on m'avait orienté sur cette fonction (extractAIC). j'en ai choisit une autre (sic). les résultats sont différents. est ce un tort que de ovuloir comprendre ? ca ne m'aide pas a justifier pourquoi l'un plutot que l'autre...
je me vois mal sortir : on m'a dit que j'étais un newbie, et que les newbies doivent utiliser sic plutot que extractAIC, les résultats sont différents, mais je suis un newbie je peux pas comprendre ... :-)

ce n'est meme pas tant pour me justifier que pour comprendre en fait, car personnelement, je n'aime pas ne pas comprendre ce que je fais...

bonne journée à tous !

Renaud Lancelot
Messages : 2484
Enregistré le : 16 Déc 2004, 08:01
Contact :

Messagepar Renaud Lancelot » 06 Juil 2007, 12:12

Je n'ai pas d'explication toute faite et ça me prendrait du temps à la chercher. Je préfère donc que ce soit vous qui passiez ce temps, et nous fassiez part de vos éventuelles conclusions. Je vous suggère de vous adresser directement à l'auteur de la fonction, Prof. Brian Ripley, chaire de stats appliquées de l'Université d'Oxford. Mais ce serait prudent de lire soigneusement la référence indiquée dans l'aide de cette fonction avant de vous adresser à Lui (il n'est d'ailleurs pas fait mention d'extractAIC dans l'ouvrage en question ce qui confirme que cette fonction n'est pas faite pour les newbies, ni peut-être pour certains encadrants).

Renaud

E.H. [compte supprimé]

Messagepar E.H. [compte supprimé] » 06 Juil 2007, 23:46

Bonsoir/Bonjour,

je vais faire le relou... vous me dites que la fonction extractAIC n'est pas à mettre dans toutes les mains. la description de la fonction indique cependant :

Computes the (generalized) Akaike Information Criterion for a fitted parametric model.

This is a generic function, with methods in base R for "aov", "glm", "lm"


Cela ne m'empechera pas de me reporter sur l'ouvrage cité en référence à l'avenir pour essayer de comprendre les différences (avec fonction sic) de la valeur d'aic obtenu et concernant le nombre de paramètre des modèles,

mais reconnaissez que :

1) soit l'aide / fichier de description est mal rédigé, car rien n'indique des conditions d'application aussi spécifiques que ce que vous voulez me faire comprendre et indique au contraire une fonction générique

2) soit tout simplement il y a encore un détail qui m'echappe

c'est tout... beaucoup d'interrogation qui me restent encore sans réponse. encore quelques heures et je bouclerais mon mémoire... avec des détails qui m'echappent encore.

encore une interrogation... si cette méthode est tellement spécifique, comment se fait il qu'elle fasse partie du package de base ?

Renaud Lancelot
Messages : 2484
Enregistré le : 16 Déc 2004, 08:01
Contact :

Messagepar Renaud Lancelot » 07 Juil 2007, 08:19

Emmanuel Henke a écrit :Bonsoir/Bonjour,

je vais faire le relou... vous me dites que la fonction extractAIC n'est pas à mettre dans toutes les mains. la description de la fonction indique cependant :

Computes the (generalized) Akaike Information Criterion for a fitted parametric model.

This is a generic function, with methods in base R for "aov", "glm", "lm"


Cela ne m'empechera pas de me reporter sur l'ouvrage cité en référence à l'avenir pour essayer de comprendre les différences (avec fonction sic) de la valeur d'aic obtenu et concernant le nombre de paramètre des modèles,


La fonction extractAIC n'est pas décrite ni même citée dans MASS4. Son inclusion dans le package de base est récente (de même que la fonction step dérivée de stepAIC du package MASS). Il y a beaucoup de fonctions dont l'usage est destiné à des spécialistes mais qui sont décrites dans l'aide, et heureusement. Il y en a d'ailleurs encore plus qui ne sont pas du tout décrites mais très utilisées par les programmeurs des packages. Dans MASS4, vous trouverez une description relativement succincte de l'AIC (p. 174-176).

mais reconnaissez que :

1) soit l'aide / fichier de description est mal rédigé, car rien n'indique des conditions d'application aussi spécifiques que ce que vous voulez me faire comprendre et indique au contraire une fonction générique


Il y a beaucoup de fonctions génériques développées pour faire des tâches très spécifiques. Une fonction générique est simplement une fonction qui va faire des calculs complètement différents selon le contexte, sans pour autant qu'il soit nécessaire ou utile que l'utilisateur soit au courant des détails. Par exemple, sic est une fonction générique avec des méthodes spécifiques pour les objets de classe aov, lm, glm.

encore une interrogation... si cette méthode est tellement spécifique, comment se fait il qu'elle fasse partie du package de base ?


Un autre exemple: vcov est une fonction générique permettant d'extraire la matrice de variance-covariance des effets fixes de la plupart des modèles courants, y compris aov, lm, glm, etc. Vous ne l'avez probablement jamais utilisée directement, et pourtant elle est mise en oeuvre à chaque fois que vous affichez les résultats d'un des modèles pré-cités. Elle est décrite dans l'aide avec tous les détails techniques nécessaires pour que des programmeurs désirant écrire de nouvelles méthodes spécifiques sachent comment procéder. C'est dans cet esprit qu'extractAIC est décrite dans l'aide.

Renaud

Nicolas Péru
Messages : 1408
Enregistré le : 07 Aoû 2006, 08:13

Messagepar Nicolas Péru » 09 Juil 2007, 06:29

La majorité des questionneurs de ce forum ne sont rien d'autres que des singes dactylographes.


désolé d'être celui qui doit relever ça et je vais tacher d'être bref.

Lorsque l'on voit des personnes qui tente d'apprendre quelque chose et qui se donnent du mal pour y arriver ou parfois qui n'appréhendent pas complètement les tenants et aboutissants de leurs questions, je pense qu'il faut les aider, les orienter, les réorienter (mot faisant référence à l'orientation du forum évoqué dans un autre post). Bref, choisissez le mot que vous voulez. Mais la moindre des choses est de leur témoigner le respect qui leur est dû. C'est la première règle de tout forum.

la première des choses pour cela est de se rappeler que certes, certains ne sont pas compétents en stat ou en R mais certainement dans leur domaine de compétence ils nous écrasent et ceci est valable pour les stagiaires. et pour réutiliser au moins un des mots qui m'a fait bondir de ma chaise...Qui peut se prétendre aussi bon grimpeur qu'un singe ?

Voilà je ne m'étendrais pas plus, c'était simplement pour que les newbies, comme on pourrait les appeler, ne se disent pas que tout le monde pense la même chose.

Bonne journée, et bon courage à tous les newbies ;)


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité