Je souhaite obtenir un tableau de statistiques descriptives pour certaines colonnes (col 13 à col 169 qui sont des données d'expression génique) d'un fichier.
En tapant
Code : Tout sélectionner
SUMMARY<-apply(Donnees[,c(13:169)],2,summary)
j'obtiens une liste.
Je souhaiterais plutôt un data.frame avec notamment le nombre de données manquantes.
J'ai essayé
Code : Tout sélectionner
array(unlist(apply(Donnees[,c(13:169)],2,summary)),dim=c(7,157))
La première colonne me donne bien les 7 chiffres recherchés. Les lignes sont respectivement min, 1st Quart, median, mean, 3rd Quart, max et Na's
Hélas, vu que je n'ai pas toujours des données manquantes, dès la seconde colonne je constate un décalage.
Or j'ai besoin du nombre de Na's pour automatiser un traitement (du genre si le nombre de Na est supérieur à un seuil donné j'écarte la donnée, sinon je pourrai essayer d'imputer).
De préférence, ce data.frame aurait les données d'expression en ligne (avec le row.name kivabien mais je devrais m'en débrouiller) et 7 colonnes.
Je peux y parvenir en mode bourrin avec des boucles for mais je veux croire qu'il existe aussi des méthodes plus élégantes :)
D'avance merci :)