Je travaille sur des listes d’œuvres exposées lors de salons parisiens de la première partie du XXe siècle dans le but d'une analyse quantitative.
Suite à une océrisation de catalogue j’obtiens ce type de liste:
Les exposants sont classés alphabétiquement et les œuvres exposées sont identifiées par un numéro (ou un numéro précédé d'un astérisque):
ALBERT (Adolphe).
28 Le quai du Petit Andely.
29 Le château Gaillard.
30 Printemps.
ALDER (Emile).
31 Les genêts.
32 Femmes du Valais (Suisse), étude.
33 Etude.
ALEXANDROVITOH (A.-J.).
*34 A. Faisant (peinture).
*35 (Docteur Sigot (pastel).
36 Emile Rousset (pastel).
Mon objectif serait d'aboutir à un tableau (un data.frame) présentant:
- en ligne: les individus (œuvres)
- en colonnes : deux caractères ( désignation / artiste).
J'ai préparé les données en remplaçant les marques de paragraphes par des séparateurs de champs et réalisé l'importation dans R mais à vrai dire je ne sais pas vraiment comment procéder et mes recherches sont restées infructueuses!
Code : Tout sélectionner
> salon<-read.table("ALBERT.txt",
+ header = FALSE, sep=";")
V1 V2
1 ALBERT (Adolphe) NA
2 28 Le quai du Petit Andely NA
3 29 Le château Gaillard NA
4 30 Printemps NA
5 ALDER (Emile) NA
6 31 Les genêts NA
7 32 Femmes du Valais (Suisse), étude NA
8 33 Etude NA
9 ALEXANDROVITOH (A.-J.) NA
10 *34 A. Faisant (peinture) NA
11 *35 (Docteur Sigot (pastel) NA
12 36 Emile Rousset (pastel) NA
> dput (salon)
structure(list(V1 = structure(c(10L, 3L, 4L, 5L, 11L, 6L, 7L,
8L, 12L, 1L, 2L, 9L), .Label = c("*34 A. Faisant (peinture)",
"*35 (Docteur Sigot (pastel)", "28 Le quai du Petit Andely",
"29 Le château Gaillard", "30 Printemps", "31 Les genêts", "32 Femmes du Valais (Suisse), étude",
"33 Etude", "36 Emile Rousset (pastel)", "ALBERT (Adolphe)",
"ALDER (Emile) ", "ALEXANDROVITOH (A.-J.)"), class = "factor"),
V2 = c(NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA)), .Names = c("V1",
"V2"), class = "data.frame", row.names = c(NA, -12L))