Comparatif d'outils de traitements Stat ?

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Abdel Zine
Messages : 75
Enregistré le : 28 Nov 2006, 09:56

Comparatif d'outils de traitements Stat ?

Messagepar Abdel Zine » 28 Nov 2006, 11:41

Bonjour à tous,

c'est mon premier message sur ce forum, alors je vais commencer par me présenter à vous :
Je suis étudiant chercheur en informatique, je travaille sur un projet de simulation de systèmes sociaux. Dans ce cadre je dois faire un couplage (connexion) entre un simulateur (développé en java) et un outil de traitement statistique, qui pourrait être "R".

Avant celà, je voudrais argumenter ce choix, et désire effectuer un comparatif entre plusieurs outils tels que : maxima, Scilab et R.
Je ne pense pas utiliser Matlab, Mathematica ou encore Maple puisque je préfère travailler avec des outils non propriétaires.

Auriez-vous connaissance d'une étude comparative entre ces différents outils, ou pourriez-vous me donner vos propres points de vue ?

J'ai trouvé ce document : http://www.scientificweb.com/ncrunch/ncrunch4.pdf mais il ne s'intéresse pas à R-Lab* (ne pas confondre avec R, désolé) et à Macsyma* (il dit qu'ils ne sont pas maintenus).

N'hésitez pas à apporter vos contributions qui seront les bienvenues.
Je vous remercie d'avance

Abdel

Edit : il y a aussi ceci : http://www.sciviews.org/benchmark/ comme comparatif mais se limite à la vitesse d'exécution des différents outils

(*) : effectivement R-Lab est un langage qui n'est plus maintenu, contrairement à R, se sont deux choses différentes.
Alors que Macsyma est repris par Maxima
Nul ne peut atteindre l'aube sans passer par le chemin de la nuit. Khalil Gibran.

Matthieu Lesnoff
Messages : 120
Enregistré le : 29 Nov 2004, 12:41

Re: Comparatif d'outils de traitements Stat ?

Messagepar Matthieu Lesnoff » 28 Nov 2006, 12:19

Abdel Zine a écrit :Bonjour à tous,

Auriez-vous connaissance d'une étude comparative entre ces différents outils, ou pourriez-vous me donner vos propres points de vue ?



Bonjour,

je ne parle que de R et Scilab (je ne connais pas maxima).

Scilab est davantage un logiciel de modelisation (systemes dynamiques, optimisation, etc.) qu'un logiciel de stat. En ce qui concerne l'analyse stat, il n'y a pas de comparaison possible, le nombre de fonctions stat deja disponibles dans R depasse completement ce qui existe en Scilab. Par contre, en termes de modelisation/simulation des systemes dynamiques, mon avis est que Scilab est mieux adapte car R a des problemes de lenteur quand on utilise les boucles avec de gros objets, ce qui est genant pour les modeles de simulations stochastiques.

En synthese, pour simuler un systeme dynamique, je conseillerais Scilab. Pour faire des stats sur des donnees issues de simulation, je conseillerais R.

Bonne continuation

Matthieu

Renaud Lancelot
Messages : 2484
Enregistré le : 16 Déc 2004, 08:01
Contact :

Messagepar Renaud Lancelot » 28 Nov 2006, 16:31

Peut-être faudrait-il faire une évaluation plus précise de vos besoins car comme le souligne Matthieu, Scilab et R ont des domaines de prédilection différents.

Les différences ont cependant tendance à s'estomper avec la disponibilité récente dans R de packages de modélisation dynamique (odesolve, msm, simecol,...) permettant d'aborder une grande variété de modèles déterministes et stochastiques. Ces packages utilisent du code C compilé.

Si vous avez uniquement besoin d'un logiciel de stats permettant de récupérer et traiter des données générées par un simulateur, je pense que R fait l'affaire car il dispose de nombreuses possibilités d'entrées - sorties (voir le document "R data import/export" livré avec R) et d'une grande richesse de fcts statistiques et graphiques.

La principale limite est peut-être la gestion de très gros tableaux, R travaillant uniquement en RAM.

Renaud

Abdel Zine
Messages : 75
Enregistré le : 28 Nov 2006, 09:56

Messagepar Abdel Zine » 28 Nov 2006, 17:59

Matthieu, Renaud,

Merci beaucoup pour vos interventions.

Matthieu Lesnoff a écrit :En synthese, pour simuler un systeme dynamique, je conseillerais Scilab. Pour faire des stats sur des donnees issues de simulation, je conseillerais R.
Matthieu


Renaud Lancelot a écrit :Si vous avez uniquement besoin d'un logiciel de stats permettant de récupérer et traiter des données générées par un simulateur, je pense que R fait l'affaire car il dispose de nombreuses possibilités d'entrées - sorties (voir le document "R data import/export" livré avec R) et d'une grande richesse de fcts statistiques et graphiques (...)

Renaud

Effectivement, comme vous avez dit plus haut dans ce que j'ai mis en gras, ce dont j'ai besoin, c'est de faire des stats sur des données issues de simulation. La simulation est faite par un autre logiciel, lequel produit des fichiers texte ou xml, que je dois exploiter comme entrées. Ces fichiers contiennent des valeurs numériques et je dois calculer leur min, max, moyenne, écart-type etc .. pour celà j'aurais besoin de R .. ou d'un autre outil de stat équivalent.

Y a t il d'autres outils pour ce genre de traitements ? Mais je suppose qu'ici on me conseillera de travailler sur R, comme ça si j'ai un problème je trouverais à qui m'adresser :D

Bonne soirée et merci pour votre aide :)

PS : message édité et completé
Nul ne peut atteindre l'aube sans passer par le chemin de la nuit. Khalil Gibran.

Abdel Zine
Messages : 75
Enregistré le : 28 Nov 2006, 09:56

Messagepar Abdel Zine » 02 Déc 2006, 10:09

Bonjour,
est ce que je pourrais trouver le document "R data import/export" livré avec R en français ?
Merci bien
Nul ne peut atteindre l'aube sans passer par le chemin de la nuit. Khalil Gibran.

Renaud Lancelot
Messages : 2484
Enregistré le : 16 Déc 2004, 08:01
Contact :

Messagepar Renaud Lancelot » 02 Déc 2006, 11:55

A ma connaissance, pas de traduction en français de ce document. Voir sur le CRAN la section sur les contributions de documents: il y en a plusieurs en français.

Voir sur ce forum dans la section adéquate une fiche présentant quelques procédures.

NB:

1. la fct query décrite dans cette fiche se trouve maintenant dans la package ttool également sur ce forum.

2. la fct query a été ré-écrite en tcl/tk (Samir Messad) et incorporée dans le package Rcmdr (interface graphique pour R) disponible sur le CRAN.

Renaud

Matthieu Lesnoff
Messages : 120
Enregistré le : 29 Nov 2004, 12:41

Messagepar Matthieu Lesnoff » 03 Déc 2006, 05:26

Abdel Zine a écrit :Effectivement, comme vous avez dit plus haut dans ce que j'ai mis en gras, ce dont j'ai besoin, c'est de faire des stats sur des données issues de simulation. La simulation est faite par un autre logiciel, lequel produit des fichiers texte ou xml, que je dois exploiter comme entrées. Ces fichiers contiennent des valeurs numériques et je dois calculer leur min, max, moyenne, écart-type etc .. pour celà j'aurais besoin de R .. ou d'un autre outil de stat équivalent.

Y a t il d'autres outils pour ce genre de traitements ? Mais je suppose qu'ici on me conseillera de travailler sur R, comme ça si j'ai un problème je trouverais à qui m'adresser :D


Juste une remarque : s'il ne s'agit que de stat descriptives de base (moyennes, variances, etc.), à mon avis il n'est pas nécessaire de faire appel à tout l'attirail R. Qd je conseillais R par rapport à Scilab, je pensais à l'utilsation de régressions, graphiques, etc. Pour les stat de base, ds tous les langages (C++, VB, etc.), sur le net, il doit deja exister des bibliothèques de fonctions qui effectuent ces calculs, qui ne sont d'ailleurs pas difficiles à reprogrammer.

Matthieu

Abdel Zine
Messages : 75
Enregistré le : 28 Nov 2006, 09:56

Messagepar Abdel Zine » 03 Déc 2006, 12:43

Bonjour,
Merci Mattieu,

J'ai oublié de dire que je dois également produire des graphiques avec les données en entrée, des histogrammes et des courbes pour pouvoir visualiser les résultats sous forme graphiques s'ils s'y prêtent.
Nul ne peut atteindre l'aube sans passer par le chemin de la nuit. Khalil Gibran.

Abdel Zine
Messages : 75
Enregistré le : 28 Nov 2006, 09:56

Messagepar Abdel Zine » 14 Jan 2007, 13:31

Encore une chose : Donc si je devais comparer des outils statistiques avec R, se serait plutôt : S-plus, Excel, SAS, SPSS, Stata, SAS, Minitab ou SPSS ?
Nul ne peut atteindre l'aube sans passer par le chemin de la nuit. Khalil Gibran.

Renaud Lancelot
Messages : 2484
Enregistré le : 16 Déc 2004, 08:01
Contact :

Messagepar Renaud Lancelot » 15 Jan 2007, 15:10

Oui, mais R (et S+) sont plus que des logiciels de stats, et je frémis à penser qu'on puisse considérer Excel comme un logiciel de stats, ou même comme un logiciel tout court. J'appelerais plutôt ça un tas de boue, mais bon...

Renaud

Abdel Zine
Messages : 75
Enregistré le : 28 Nov 2006, 09:56

Messagepar Abdel Zine » 15 Jan 2007, 15:42

ha ha !
Oui je te comprends Renaud, mais c'est le marché qui le veut, moi je compare objectivement des outils (de traitements stats) et leurs fonctionnalités ;)
Merci !
Nul ne peut atteindre l'aube sans passer par le chemin de la nuit. Khalil Gibran.

Renaud Lancelot
Messages : 2484
Enregistré le : 16 Déc 2004, 08:01
Contact :

Messagepar Renaud Lancelot » 15 Jan 2007, 18:58

Si on est dans ce cadre, je déconseille vivement l'utilisation d'Excel pour traiter des données, et cela avec des arguments objectifs. Voir par exemple http://www.burns-stat.com/pages/Tutor/spreadsheet_addiction.html.

Il m'est d'ailleurs très récemment arrivé une nouvelle mésaventure avec Excel. Lors d'importation de données de comptage depuis MS Excel vers MS Access, en utilisant l'interface d'Access, j'ai constaté que les nombres 1 de la feuille Excel devenaient des 2 dans la table Access. L'exemple est reproductible et j'ai les fichiers pour ceux que ça intéresse.

Renaud


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité