Bonjour, je doit travailler sur des données de network analysis concernant les citation de paper de physique entre 1992 et 2002.
Les fichier en txt. sont en format edge liste.
La liste des nodes contient une citation de chaque id (paper) par année, cela ne me permet pas de construir un graphe.
nodes <- data.frame(read.table("cit-HepPh-dates.txt", header=T, as.is=T))
links <- data.frame(read.table("Cit-HepPh.txt", header=T, as.is=T))
cit <- graph.data.frame(links, nodes, directed = TRUE)
Voici l'erreur qui me donne
Error in graph.data.frame(links, nodes, directed = TRUE) :
Duplicate vertex names
Je sais qu'il y a 2 package dyprl et reshape2 qui peuvent me permettre de manipuler les données, mais pour l'instant je n'ai rien trouvé d'interessant.
voici le liens pour les données
http://snap.stanford.edu/data/cit-HepPh.html
Merci d'avance!