Exercice language R

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Hervieu Benoît
Messages : 6
Enregistré le : 20 Fév 2019, 07:14

Exercice language R

Messagepar Hervieu Benoît » 20 Fév 2019, 07:52

Bonjour,

je me permets de poser un exercice du langage R ici avec les réponses que j'ai pu faire, j'aimerais avoir votre avis la dessus ( je suis nouveau sur R, :

je dispose d'une mise en données (pourcentage d'une molécule dans le produit, le but est de prédire l'origine ce produit, j'ai 9 colonnes X1:X8 sont les pourcentages de certains tests chimique , la colonne 9 est le ID de la ville. Une partie de la mise en données est ci-joint

désolé je n'ai pas réussi à charger le fichier !!!

1)Construire un tableau X avec les 8 variables quantitatives centrées et réduites. Dans toute la
suite, on travaillera sur les données centrées réduites.

Réponse :

data=read.csv("nom du fichier",header=T,sep=";")

2)Représenter, à l’aide d’outils graphiques disponibles sous l’information contenue dans
les 8 variables X1, X2, X3, X4, X5, X6, X7, X8 avec le package lattice.

Réponse:

j'utilise splom(data[,1:8]).

j'ai remarqué que les variables X1,X2,X4 sont intéressantes pour prédire l'origine du produit (" à moins que j'ai faux")

3)Effectuer l’ACP sur le tableau X. Donner le pourcentage de variance expliqué par les
différents axes de l’ACP.

Réponse:

la je sèche un peu soit j'utilise data_acp=princomp(data[,1:8]) soit data_acp=princomp(data[,1:8],cor =T).
pourcentage de variance expliqué: summary(data_acp).

je ne sais pas trop la différence entre les deux !!!

4)Construire un tableau Z contenant les coordonnées des observations sur les deux premiers
axes principaux.

Réponse:

score_acp=data_acp$scores[,1:2]


5)Effectuer une classification en 9 classes avec la méthode des K-means à partir du tableau Z
Réponse:

data_kmean=kmeans(score_acp,9)

pour l'instant je n'ai fait que cela, pourriez vous me dire si j'ai bon ou faux !!

par ailleurs j'ai fait un tableau pour comparer les résultats de Kmeans avec ID_VILLES Mad Mad

table(data$ID_VILLES,data_kmean$cluster)
c'est pas bon du tout confused confused confused

Est ce que j'ai faux quelque part !!

Merci d'avance pour vos réponses



Voici une partie des données, en attendant de trouver un problème du chargement des donnes

X1;X2;X3;X4;X5;X6;X7;X8;ID_VILLES
41.3;22.6;33.2;72.2;21.9;47.2;56.3;48.2;1
42.5;21.9;32.3;66.8;32.6;40.3;57.3;48.2;1
26.8;14.7;42.2;85.9;9.9;40.3;59.2;48.2;1
31.6;15.8;39.5;78.3;16.7;66.7;73.8;58.9;1
39.2;19.6;48.0;69.7;21.9;66.7;75.7;78.6;1
26.8;12.8;52.0;77.0;22.5;68.1;66.0;75.0;1
63.2;45.7;29.1;41.4;49.1;56.9;59.2;50.0;2
66.6;37.7;42.2;44.3;41.7;59.7;59.2;28.6;2
68.3;36.2;53.8;39.2;48.1;61.1;60.2;37.5;2
60.9;35.5;41.7;45.2;44.5;56.9;58.3;64.3;2
59.1;40.0;28.3;46.7;43.4;52.8;64.1;69.6;2
64.5;39.6;74.4;37.1;45.7;66.7;66.0;64.3;2
62.1;40.4;39.9;45.4;41.3;61.1;68.0;58.9;2
64.9;37.4;16.6;49.1;36.4;63.9;68.0;33.9;2
65.5;67.5;20.2;46.3;43.7;31.9;42.7;23.2;3
67.0;71.3;32.7;29.8;62.2;26.4;46.6;21.4;3
71.1;69.4;28.7;39.3;49.6;26.4;44.7;30.4;3
68.8;61.5;25.1;38.2;53.9;37.5;63.1;42.9;3
71.3;64.2;29.1;25.7;73.9;44.4;68.0;53.6;3
71.1;81.9;57.4;19.7;76.8;41.7;56.3;39.3;3
79.9;73.2;47.1;16.4;77.5;55.6;58.3;50.0;3
75.3;63.0;51.6;34.1;40.6;54.2;79.6;62.5;4
63.7;47.2;18.4;48.7;36.7;47.2;82.5;58.9;4
61.6;32.1;44.4;35.3;58.8;52.8;81.6;67.9;4
74.1;60.4;48.0;27.3;56.7;44.4;73.8;53.6;4
79.6;86.0;33.2;31.4;40.1;38.9;68.0;44.6;4
72.8;55.5;31.8;29.2;58.0;48.6;72.8;67.9;4
78.3;55.5;26.5;32.9;47.0;48.6;92.2;64.3;4
69.6;42.6;26.5;42.1;41.3;50.0;88.3;67.9;4
70.6;44.9;26.0;38.4;46.5;52.8;96.1;73.2;4
42.8;33.6;36.8;50.0;66.3;36.1;54.4;.0;5
45.2;24.9;30.0;52.6;59.6;43.1;76.7;.0;5
44.1;29.4;26.9;51.2;64.2;45.8;64.1;.0;5
38.8;32.5;38.6;51.4;65.8;36.1;84.5;.0;5
49.3;31.7;27.8;48.9;63.9;27.8;63.1;.0;5
48.7;26.0;22.0;48.7;66.0;37.5;72.8;.0;5
43.1;27.5;22.9;52.8;63.1;48.6;73.8;.0;5
50.3;22.6;23.8;51.9;64.5;43.1;69.9;.0;5
43.8;35.5;30.5;49.1;67.7;36.1;55.3;.0;5
44.6;29.1;25.6;50.0;66.2;41.7;68.9;.0;5
42.8;29.4;31.4;51.0;65.1;25.0;49.5;.0;5
41.8;31.3;30.0;50.8;66.2;43.1;73.8;.0;5
39.2;35.1;33.6;52.3;65.2;38.9;62.1;.0;5
42.1;30.6;39.5;40.9;86.3;36.1;53.4;.0;6
42.3;42.3;44.8;40.7;81.9;36.1;58.3;.0;6
47.1;30.2;47.5;37.2;88.0;29.2;67.0;.0;6
46.9;32.5;45.7;38.1;84.3;31.9;64.1;.0;6
48.8;35.8;48.9;36.4;83.1;34.7;72.8;.0;6
46.3;27.2;25.1;41.2;84.1;36.1;53.4;.0;6
50.2;35.1;27.8;36.8;84.1;43.1;80.6;.0;6
41.4;23.4;22.4;44.7;83.9;37.5;63.1;.0;6
53.3;20.8;43.9;59.7;32.5;52.8;85.4;.0;7
54.2;24.5;30.5;58.8;31.5;80.6;95.1;.0;7
50.7;32.1;17.0;57.8;36.4;66.7;95.1;.0;7
48.9;28.3;30.5;60.7;33.5;52.8;85.4;.0;7
46.2;32.1;39.5;62.6;32.5;38.9;85.4;.0;7
41.8;32.1;48.4;66.8;29.5;25.0;66.0;.0;7
42.7;28.3;57.4;67.8;26.6;66.7;95.1;.0;7
36.4;32.1;52.9;69.7;25.6;52.8;85.4;.0;7
42.7;28.3;43.9;65.4;30.5;80.6;75.7;.0;7
45.3;32.1;48.4;67.3;22.7;38.9;75.7;.0;7
41.8;24.5;39.5;72.5;21.7;38.9;66.0;.0;7
48.9;20.8;35.0;73.9;18.8;11.1;17.5;.0;7
43.6;24.5;39.5;72.0;21.7;25.0;66.0;.0;7
40.0;39.6;26.0;61.6;55.0;.0;.0;.0;8
56.0;50.9;43.9;62.1;27.6;11.1;7.8;.0;8
40.0;28.3;70.9;73.5;23.7;.0;.0;.0;8
36.4;32.1;61.9;62.6;50.1;.0;7.8;.0;8
32.0;28.3;30.5;66.4;56.0;.0;.0;.0;8
50.7;43.4;30.5;54.5;55.0;.0;7.8;.0;8
40.0;47.2;39.5;65.9;39.3;11.1;7.8;.0;8
33.8;32.1;43.9;63.0;56.9;.0;.0;.0;8
35.6;28.3;88.8;63.0;48.1;11.1;.0;.0;8
38.2;28.3;43.9;70.1;36.4;11.1;7.8;.0;8
38.2;28.3;43.9;71.6;35.4;11.1;7.8;.0;8
36.4;28.3;88.8;62.6;46.2;11.1;.0;.0;8
36.4;28.3;48.4;62.6;55.0;.0;.0;.0;8
35.6;28.3;88.8;62.1;47.2;11.1;.0;.0;8
27.6;35.8;84.3;67.3;45.2;.0;.0;.0;8
43.1;15.1;21.5;77.7;14.9;45.8;41.7;.0;9
41.8;20.8;16.1;78.9;15.7;36.1;33.0;.0;9
42.7;17.0;19.3;78.2;14.9;41.7;35.0;.0;9
44.0;15.1;21.5;75.8;14.4;51.4;52.4;.0;9
44.4;13.2;23.8;75.8;14.4;52.8;48.5;.0;9
41.3;20.8;20.6;79.5;15.7;36.1;30.1;.0;9
41.3;18.9;14.8;79.6;15.7;45.8;38.8;.0;9
40.4;22.6;12.6;79.4;15.9;31.9;46.6;.0;9
40.9;22.6;16.1;79.6;15.1;27.8;41.7;.0;9
40.9;22.6;16.1;79.6;15.1;27.8;41.7;.0;9
43.6;20.8;21.5;76.3;15.9;51.4;40.8;.0;9
41.3;20.8;14.8;78.7;15.9;27.8;54.4;.0;9
39.1;23.8;10.3;80.1;15.9;22.2;55.3;.0;9
42.7;17.0;20.6;78.0;14.9;41.7;32.0;.0;9
39.1;23.8;16.1;80.1;15.7;36.1;20.4;.0;9

Hervieu Benoît
Messages : 6
Enregistré le : 20 Fév 2019, 07:14

Re: Exercice language R

Messagepar Hervieu Benoît » 20 Fév 2019, 12:50

Personne ne peut m'aider ??? :/

Pierre-Yves Berrard
Messages : 696
Enregistré le : 12 Jan 2016, 23:30

Re: Exercice language R

Messagepar Pierre-Yves Berrard » 20 Fév 2019, 13:06

La réponse à la question 1 est fausse.
PY

Hervieu Benoît
Messages : 6
Enregistré le : 20 Fév 2019, 07:14

Re: Exercice language R

Messagepar Hervieu Benoît » 20 Fév 2019, 13:15

pourriez vous m'en dire plus svp , parce que quand je fais summary (data)

'data.frame': 572 obs. of 10 variables:
$ X1 : num 41.3 62.7 75 54.4 46.1 46.7 60.4 51.6 42.2 42.5 ...
$ X2 : num 22.6 46.8 63.4 44.5 39.6 31.3 17 50.9 20.8 21.9 ...
$ X3 : num 33.2 35 19.7 33.6 31.4 44.4 48.4 61.9 12.6 32.3 ...
$ X4 : num 72.2 47.3 35.9 53.3 46.1 38.9 59.2 49.3 78.4 66.8 ...
$ X5 : num 21.9 37.6 55.4 36.8 65 84.7 21.7 56 15.4 32.6 ...
$ X6 : num 47.2 55.6 34.7 47.2 56.9 25 94.4 0 25 40.3 ...
$ X7 : num 56.3 56.3 42.7 65 93.2 57.3 95.1 7.8 46.6 57.3 ...
$ X8 : num 48.2 53.6 30.4 58.9 0 0 0 0 0 48.2 ...
$ ID_VILLES: int 1 2 3 4 5 6 7 8 9 1 ...

Pierre-Yves Berrard
Messages : 696
Enregistré le : 12 Jan 2016, 23:30

Re: Exercice language R

Messagepar Pierre-Yves Berrard » 20 Fév 2019, 13:23

énoncé a écrit :variables quantitatives centrées et réduites. Dans toute la suite, on travaillera sur les données centrées réduites.
PY

Hervieu Benoît
Messages : 6
Enregistré le : 20 Fév 2019, 07:14

Re: Exercice language R

Messagepar Hervieu Benoît » 20 Fév 2019, 13:27

Merci encore pour votre réponse rapide, dans l’énoncé c'est écrit :Columns 1-8: normalized fatty acid concentrations (between 0 and 100 %) .

à votre avis c'est encore pas bonne la réponse à la première question . si oui comment je dois procéder afin de les rendre " données centrées réduites"
Merci d'avance

Hervieu Benoît
Messages : 6
Enregistré le : 20 Fév 2019, 07:14

Re: Exercice language R

Messagepar Hervieu Benoît » 20 Fév 2019, 14:07

je pense utiliser cr<-as.data.frame(lapply(data[1:8], scale, center=T, scale=T))

est ce que c'est bon pour la 1er question ??

Serge Rapenne
Messages : 1308
Enregistré le : 20 Aoû 2007, 15:17
Contact :

Re: Exercice language R

Messagepar Serge Rapenne » 20 Fév 2019, 14:41

En réponse à votre message privé.

pourriez vous jeter un petit coup d'oeil sur le problème que j'ai avec un exercice en R :
viewtopic.php?f=3&t=9515&p=43890#p43890

Non je ne peux pas
Si vous avez envoyé ce message à tous les utilsateurs régulier du forum vous n'allez pas vous faire des amis ici

Serge

Hervieu Benoît
Messages : 6
Enregistré le : 20 Fév 2019, 07:14

Re: Exercice language R

Messagepar Hervieu Benoît » 20 Fév 2019, 14:59

Bonjour Serge,

Désolé si je vous ai offensé, j'ai simplement regardé votre profile (comme vous étiez le seul connecté), j'ai vu que vous étiez bien actif sur ce forum, de plus vu les sujet que vous avez résolu je me suis permis de penser que vous étiez apte à m'aider, si le message vous a perturbe veuillez m'excuser j'ai pensé que c'était demandé poliment

Bonne journée


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Bing [Bot] et 1 invité