j'aurais besoin d'aide pour creer une fonction qui trierait les donnees de type "character" d'une colonne d'un dataframe et remplacerait le contenu selon le nombre et la valeur du(des) caractere(s).
Pour etre plus claire, voici mon example:
ASSAY SAMPLE GENOTYPE
M1 01 A
M2 01 C
M3 01 TC
M1 02 A
M2 02 C
M3 02 TC
M1 03 A
M2 03 TC
M3 03 TC
M1 04 CA
M2 04 C
M3 04 TC
M1 05 CA
M2 05 C
M3 05 TC
je voudrais trier la colonne GENOTYPE pour:
- remplacer les nchar=1 par deux fois la valeur du caractere: ex= A par AA, C par CC, etc...
- remplacer les nchar=2 par "caractere1/caractere2", soit inserer un / entre les deux caracteres: ex=TC par T/C, CA par C/A, ...
et pouvoir appliquer cette fonction dans le cas ou j'aurais plusieurs colonnes de type GENOTYPE.
J'image qu'on doit pouvoir combiner nchar() et replace() du genre
Code : Tout sélectionner
if (nchar(example$GENOTYPE_ID)=1) replace(example, example=x, xx)
if (nchar(example$GENOTYPE_ID)=2) replace(example, example=xy, x/y)
mais, comme vous pouvez le voir, je suis carrement incompetente en programmation
Merci d'avance.