Données végétation

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Sara Roux
Messages : 13
Enregistré le : 17 Sep 2011, 19:14

Données végétation

Messagepar Sara Roux » 19 Sep 2011, 06:35

Bonjour,
j’ai deux question concernant l’analyse des données de mon travail de diplôme, est-ce que quelqu’un pourrait m’aider?
J’ai une base de données à disposition avec les informations suivantes:

Coordonnées géographiques
Nom de l'espèce
Presence de l'espèce en juin ( 1 ou 0)
Presence de l'espèce en aout (1 ou 0)
informations sur l'altitude
autres informations

Les espèces se répetent. J’aimerais calculer, pour chaque espèce, la fréquence des présences en juin pour la comparer à la fréquence en août. Comme j’ai 39.000 donnée si je dois le faire à la main, et je n’ai pas beaucoup de temps à disposition, je voulais savoir si c’était possible de le programmer en R.
J’aimerais créer une fonction que a chaque fois qu’il y a une nouvelle espèce, commence à compter e fasse la somme à la fin. Après j’aimerais que le résultat s’affiche directement dans un data.frame. J’ai essayé mais sans aucun résultats. Est-ce quelqu’un pourrait m’aider?
J’ai aussi une question d’ordre statistique: après avoir calculé les fréquences, serait-il possible d’appliquer un test pour voir si sa vaut la peine de faire des relevés en juin et août?

Merci beaucoup pour la disponibilité

Sara

Nicolas Péru
Messages : 1408
Enregistré le : 07 Aoû 2006, 08:13

Messagepar Nicolas Péru » 19 Sep 2011, 09:49

Bonjour,

Si je comprends bien les fonctions telles que by() ou aggregate appliquée avec le nom d'espèce et la date devraient faire ça en 2s. Mais la présentation de tes données est un peu vague. Un extrait serait plus parlant pour pouvoir te proposer quelque chose de plus concret.

Nicolas

PS : pour ta question stat, comment veux tu savoir si ça vaut le coup de faire des relevés en juin et août si tu n'as pas d'autres dates comme point de repère. D'autre part, il faudra faire un choix de critères de comparaison (richesse, abondance...) car "ça vaut le coup" c'est très subjectif...

Sara Roux
Messages : 13
Enregistré le : 17 Sep 2011, 19:14

Messagepar Sara Roux » 19 Sep 2011, 11:30

Salut,
merci beaucoup pour ta réponse.
Voici quelque détail supplémentaire concernant les données :

Coord.géo Espèce D1(Juin) D2(août) Ut. du sol Alt.

1. 785186 Carex fl. 1 1 pâturage 1234
2. 785186 Plantago m. 0 1 pâturage 1234
3. 491114 Plantago m. 1 0 prairie 800
4. ...............................................................................................

Merci beaucoup pour l'aide!!!

Sara[/img][/list]

Nicolas Péru
Messages : 1408
Enregistré le : 07 Aoû 2006, 08:13

Messagepar Nicolas Péru » 19 Sep 2011, 12:00

Essaye :

Code : Tout sélectionner

apply(ton_data[,c(3,4)],2,tapply,Espece,sum)


ça te donnera les sommes d'occurences pour chaque espèce pour les colonnes juin et aout.
C'est le code "basique" pour ce genre de chose. Comme indiqué précédemment les fonctions by() et aggregate sont à connaitre et à maitriser pour toutes les questions de regroupement selon un facteur

Nicolas

PS: une recherche sur le forum devrait te donner de nombreux exemples d'utilisation de by et aggregate ou du apply(...,tapply..) que je t'ai donné.

Sara Roux
Messages : 13
Enregistré le : 17 Sep 2011, 19:14

Messagepar Sara Roux » 19 Sep 2011, 12:19

ça marche!!!! merci beaucoup!!!!!

Sara Roux
Messages : 13
Enregistré le : 17 Sep 2011, 19:14

Hallo :o)

Messagepar Sara Roux » 21 Sep 2011, 13:32

Salut,
j’aurais une autre question concernant mes données.
Maintenant j’ai calculé le pourcentage d’espèces présentes lors du premier relevé. J’aimerais voir si ce pourcentage c’est influencé par des autres variables que j’ai à disposition, comme par exemple l’habitat (voir exemple).
En R j’aimerais donc calculer ce pourcentage pour les relevés effectues dans les prairies et le comparer avec les relevés effectués dans les pâturages par exemple. Il y a-t-il un moyen pour automatiser le procedé ?

1. Extraire les données : spe[Habitat == pâturage]
2. Extraire les espèces que presentes lors du premier relevés et pas dans le deuxième spe[S1==1 & S2==0,]
3. Compter combien sont ces espèces ( ? ) avant j’ai utilisé la fonction dim() pour avoir ce nombre, il y a-t-il une autre fonction ?
4. Calculer le pourcentage des espèces présentes que lors du premier relevés (j’ai donc besoin d’extraire le nombre totale des espèces.

J’aimerais automatiser la chose car j’ai beaucoup des différentes milieux, mais je n’arrive pas à construire la fonction.

Merci beaucoup

Sara


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Google [Bot] et 1 invité

cron