Méthode d'analyse numérique pour R

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Christophe Genolini
Messages : 698
Enregistré le : 12 Juin 2006, 21:37
Contact :

Méthode d'analyse numérique pour R

Messagepar Christophe Genolini » 19 Juil 2019, 15:11

Bonjour

Je cherche a en savoir plus sur les méthodes d'analyse numérique que R utilise, ainsi que leur optimisation. Exemple :
  • la formule de l'écart type qu'on trouve dans un livre de math, c'est 1/n \sum(x_i - Mean(x))^2
  • Mais R calcule l'écart type corrigé 1/(n-1) \sum (x_i - Mean(x))^2
  • Et surtout il utilise la formule simplifiée 1/(n-1) [\sum(x_i^2) - Mean(x)^2]
Savez-vous ou je peux trouver ce genre d'information ?

Je cherche en particulier des détails sur le t de Student et le test des rangs de Wilcoxon.
Christophe
--
Christophe
https://rplusplus.com

Florent Aubry
Messages : 324
Enregistré le : 25 Juin 2010, 10:21

Re: Méthode d'analyse numérique pour R

Messagepar Florent Aubry » 21 Juil 2019, 17:51

R est un logiciel statistique, il utilise donc ce qu'on sait sur les estimateurs. Les informations que tu cherches relèvent donc de tout bon livre sur les statistiques et de quelques notions de mathématiques. Cette question ne relève donc pas d'un forum spécifique à la programmation sous R.

Maxime Hervé
Messages : 427
Enregistré le : 03 Mar 2010, 14:21
Contact :

Re: Méthode d'analyse numérique pour R

Messagepar Maxime Hervé » 22 Juil 2019, 07:00

Bonjour,
pour ce qui est de ce que R fait exactement, la meilleure solution reste de décortiquer le code source des fonctions même si ce n'est pas toujours marrant (et pour peu qu'il ne fasse pas appel à du C). En l'occurrence avec les tests de Student (stats:::t.test.default) et de Wilcoxon (stats:::wilcox.test.default) ça m'a l'air assez limpide.
Maxime

Christophe Genolini
Messages : 698
Enregistré le : 12 Juin 2006, 21:37
Contact :

Re: Méthode d'analyse numérique pour R

Messagepar Christophe Genolini » 24 Juil 2019, 09:26

Florent Aubry a écrit :Cette question ne relève donc pas d'un forum spécifique à la programmation sous R.

Cher Florent,

Je trouve votre remarque particulièrement déplacé. Vous n'avez, a ma connaissance, aucune autorité pour décider ce qu'il est légitime de poster sur le forum. Si vous estimez qu'un sujet est hors topic, vous avez le droit de ne pas y répondre. Mais, vous n'êtes PAS mandaté pour faire la police (j'ai demandé au modérateur, et j'ai eu confirmation).

J'attire votre attention sur le caractère courtois, familial et bienveillant du GuR (en parti en réaction au caractère très agressif de la r-help ?) : on poste ici de manière non anonyme, quand un débutant pose une question triviale qu'il aurait pu trouver dans n'importe quel livre, on lui répond quand même et on ne se prend jamais de GIYF ou de RTFM. Je le sais d'autant mieux que lors de mon arrivé sur le GuR il y a 13 ans, j'ai moi-même répondu que la solution a un problème était facilement accessible via google, et on m'a gentillement expliqué que cela ne se faisait pas ici.

Bref, si vous avez des envies de modération, je vous invite a aller sur un forum ou de telles choses se pratiquent. A l'avenir, je vous serais reconnaissant de laisser mes posts tranquilles.

Cordialement
Christophe
--
Christophe
https://rplusplus.com

Florent Aubry
Messages : 324
Enregistré le : 25 Juin 2010, 10:21

Re: Méthode d'analyse numérique pour R

Messagepar Florent Aubry » 24 Juil 2019, 10:58

Cher Christophe

Vous avez parfaitement le droit de considérer que votre question relève de ce forum, c'est votre opinion. Personnellement, je trouve votre post public particulièrement déplacé d'autant que si vous savez parfaitement que sur ce forum, je ne suis pas le seul à signaler publiquement des questions qui semblent hors sujet du forum et qu'il y a pourtant de nombreuses réponses où il est conseillé à la personne de chercher via google. Il ne me semble pas que jusqu'ici les personnes ayant reçu de telles réponses s'en soient offusquées, au moins publiquement.

Considérant ma faible connaissance des statistiques et de R, je persiste à penser quoique vous en disiez qu'on peut trouver les réponses aux questions dans un livre de statistiques, et il y en a tellement que la liste serait trop longue et fastidieuse. La formule implantée dans R pour estimer la variance (l'écart-type étant la racine carrée de la variance) est, et vous le savez comme moi, l'estimateur non biaisé de la variance d'une population à partir d'un échantillon aléatoire de taille n, la formule simplifiée est connue car c'est un exercice classique dans les cours d'introduction aux statistiques. Donc, peut-être n'avez-vous pas été très clair dans l'énoncé et est-ce des problèmes, légitimes, d’optimisation qui vous préoccupe ? Auriez-vous réagi différemment si je vous avais répondu comme la fait Maxime Hervé de regarder les codes ?

Enfin, permettez_moi de vous demander la traduction en français de votre réponse. Que signifie GIYF et RTFM ?

Cordialement

Florent

P.S. : Je considère cette polémique comme close.

Pierre-Yves Berrard
Messages : 1029
Enregistré le : 12 Jan 2016, 23:30

Re: Méthode d'analyse numérique pour R

Messagepar Pierre-Yves Berrard » 24 Juil 2019, 12:15

Image
PY

Maxime Hervé
Messages : 427
Enregistré le : 03 Mar 2010, 14:21
Contact :

Re: Méthode d'analyse numérique pour R

Messagepar Maxime Hervé » 24 Juil 2019, 12:32

Florent Aubry a écrit :Auriez-vous réagi différemment si je vous avais répondu comme la fait Maxime Hervé de regarder les codes ?

Histoire qu'il n'y ait pas de malentendu : je n'ai pas sous-entendu "démerde-toi et regarde les codes !" Simplement, chaque fois que je suis confronté au même type de questionnement que Christophe (si j'ai bien compris ta question), c'est par là que j'en passe. Ce n'est franchement pas amusant, mais au moins on comprend exactement ce qui est fait. Ici en l'occurrence, ce n'est pas horrible car Christophe sait bien le genre de choses qu'il va trouver dans le test de Student et le test de Wilcoxon, et les développeurs des fonctions en question ont eu la bonne idée de nommer leurs objets assez clairement.
Maxime

Christophe Genolini
Messages : 698
Enregistré le : 12 Juin 2006, 21:37
Contact :

Re: Méthode d'analyse numérique pour R

Messagepar Christophe Genolini » 24 Juil 2019, 13:29

Florent Aubry a écrit :vous savez parfaitement que sur ce forum, je ne suis pas le seul à signaler publiquement des questions qui semblent hors sujet du forum

Justement, je trouve que ce type de réponses, de plus en plus fréquentes, ne sont pas du tout dans l'esprit du forum. Le modérateur ne censure personne. Si ma question ne vous plait pas, vous pouvez simplement passer à la suivante. Par contre, venir la flooder en m'expliquant qu'elle n'a rien a faire là ne fait pas parti de vos attributions.

Au passage, si vraiment m'a question n'a rien à faire là, alors personne ne va y répondre. Pas besoin qu'une autorité auto-proclamé s'en mêle.

Auriez-vous réagi différemment si je vous avais répondu comme la fait Maxime Hervé de regarder les codes ?

Bien sur ! "Regarder les codes", c'est une proposition de solution. Dire que "ma question n'a rien a faire là", c'est un jugement de valeur.

Mais je suis d'accord avec vous, clôturons là notre différent.

La formule implantée dans R pour estimer la variance

La variance est un cas trivial, effectivement elle est détaillé dans tous les livres. Je ne l'ai donné que pour expliquer ce que je cherchais.

Mais prenez le khi2. La formule qu'on trouve dans les livres de stats n'est pas celle utilisée par R dans le cas 2x2. Je m'en suis rendu compte parce qu'un jour un reviewer m'a demandé d'utiliser l'approximation de Yate, ce que R fait.

Combien d'autre statistiques sont différentes entre les livres et R ? Je n'ai pas la réponse. Et je ne demande pas la réponse, je demande ou je peux la trouver !


Enfin, permettez_moi de vous demander la traduction en français de votre réponse. Que signifie GIYF et RTFM ?

Google Is Your Friend
Read The Fucking Manuel

Maxime a écrit : Histoire qu'il n'y ait pas de malentendu : je n'ai pas sous-entendu "démerde-toi et regarde les codes !"

Zéro soucis, Maxime, j'avais bien compris. Votre réponse me convient pour les cas simples. Après, pour les truc plus balaises genre calcul de la vraisemblance pour une régression logistiques, le code risque de devenir plus difficile a lire...

Christophe
--
Christophe
https://rplusplus.com


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité