@Jean : j'avoue qu'en bon prof de fac, le modèle économique est sans doute ce qui pèche le plus... Peux-tu m'en dire plus sur celui de RStudio ?
@Pierre-Yves : la première version, on améliore "juste" l'interface. On simplifie le data management et l'export des données. Assez vite, on va aussi travailler sur la fusion de base, l'automatic reporting et divers petits trucs qu'on a dans nos cartons.
La V2, on aura refait le moteur, compilateur et fonctions. Donc on ira beaucoup beaucoup plus vite que les implémentations classiques. "Beaucoup beaucoup", c'est entre 100 et 800 fois plus vite.
@Serge : niveau grammaire et langage, on va faire deux choses :
- Uniformisation des instructions. Actuellement, pour calculer la moyenne des colonnes, je ne sais jamais si l'instruction est colmeans, colMeans, col.means ou encore col_means. Dans R++, toutes les fonctions auront des noms basées sur les mêmes règles.
- Typage : les variables seront implicitement typées, et on ne pourra pas stocker un nominal dans un integer, ou inversement. Donc le code
deviendra incorrect, parce que l'instruction "age<-3" affectera le type "integer" à "age", et donc "age" ne pourra plus recevoir "toto" qui est un string. Cette étape est obligatoire pour avoir du code compilé, et le code compilé est le passage obligé pour la haute performance.