J'ai besoin d'aide pour extraire une chaine de caractère. J'aimerai pouvoir récupérer le numéro du chromosome indiqué dans la colonne ID (chiffre après la chaine de caractère chr).
Pour cela j'aimerai utiliser la fonction mutate du package dplyr pour créer une nouvelle variable mais j'ai du mal à trouver comment récupérer le chiffre correspondant au chromosome pour créer cette nouvelle variable. Voici un exemple ci dessous de données.
Merci d'avance pour votre aide,
Aline
Code : Tout sélectionner
ID=c("hg19_ct_UserTrack_xjizeijsisidu_chr1:44788752","hg19_ct_UserTrack_xoijugisidu_chr1:1874526","hg19_ct_UserTrack_xoijiuytisidu_chr1:187487526")
index=c(1,2,3)
data.frame(index, ID)
Code : Tout sélectionner
index ID
1 1 hg19_ct_UserTrack_xjizeijsisidu_chr1:44788752
2 2 hg19_ct_UserTrack_xoijugisidu_chr1:1874526
3 3 hg19_ct_UserTrack_xoijiuytisidu_chr1:187487526