Bonjour,
J'ai deux tableaux.
1er tableau : contient mes sous groupes de référence avec plusieurs paramètres
nom_du_groupe/longueur_sequence/sequence/statut_mutationnel/nom_du_gene/...
2ème tableau : mon tableau patient
Mon but est que dans mon tableau patient je retrouve mes sous groupes de référence. Pour cela, j'essaie de réaliser une boucle for pour qui screen chaque ligne de mon patient et qu'il les compare avec mon tableau de référence.
Pour éviter qu'il le fasse 2 à 2 je voulais qu'il ne screen par exemple que les lignes où la longueur de séquence est la même dans les deux tableaux, qu'il calcul une similarité entre mes séquences screené et qu'il puisse m'ajouter le nom du sous groupe dans une colonne ajoutée.
Il me calcul la similarité par rapport la première séquence de mon tableau 1 (référence).
for (j in 1:nrow(tableau1)){
tableau2$longueur_sequence == tableau1$longueur_sequence[j]
score <- sum(strsplit(tableau1$sequence, split = "")[[1]] == strsplit(tableau$sequence[i], split = "")[[1]])
homology <- score/(length(strsplit(tableau1$sequence, "")[[1]]))
tableau2$similarite[i] <- homology
}
Merci d'avance de vos réponses
Marine