Codage variable semi-quantitative et mesures répétées dans le temps

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Line Jolivet
Messages : 1
Enregistré le : 20 Mai 2020, 09:47

Codage variable semi-quantitative et mesures répétées dans le temps

Messagepar Line Jolivet » 20 Mai 2020, 13:13

Bonjour à tous,
Je sollicite votre aide car je bloque sur le codage sur R de mes données expérimentales. Je vous remercie par avance, toute piste ou comparaison à une étude que vous auriez pu croiser me sera très utile !

Je teste un produit à visant les parasites digestifs sur des jeunes vaches. 80 vaches de 5 élevages différents font partie de mon étude, elles sont divisées en un lot témoin et un lot traité. J’ai réalisé 3 séries de coproscopies donnant le nombre d’œufs de parasites digestifs émis dans les bouses.
Je travaille sur une de ces mesures : la quantité de Strongles digestifs.
J'ai 5 données explicatives : le numéro de prélèvement (plutôt pour information), le nom de l’élevage, le numéro de la génisse, si elle est dans le groupe des témoins ou des traitées, le temps de contact effectif (TCE) (c'est-à-dire le temps qu'elle a passé au pré, important à noter car plus elle passe de temps au pré, plus elle risque d’être contaminée par les parasites digestifs).
Ma donnée à expliquer est la quantité de Strongles digestifs.
Je voudrais voir s'il existe une différence de contamination par les Strongles digestifs entre les groupes témoins et traitées.

Je fais face à beaucoup de difficultés dans mes données :
- Il y a une grande proportion de 0 (dans les quantités de Strongles émis)
- La distribution des valeurs non nulles n’est pas normale
- Les mesures sont répétées dans le temps
- Il existe un facteur élevage
- Le plan d’expérience est différent entre les génisses, car j’ai réalisé les coproscopies à une date t, mais toutes les génisses n’avaient pas le même temps de contact effectif (elles ne sont pas toutes sorties en même temps au pré).

J’ai essayé de faire un code en utilisant une moyenne des temps de contact, mais cela fait perdre beaucoup d’informations. J’ai aussi essayé de comparer les groupes témoins et traitées à chaque temps de contact, mais cela revient à comparer entre elles les quelques génisses qui ont le même temps de contact.
Vous trouverez ci-dessous mon jeu de données.

Auriez-vous des idées d’approche sous R ? Des pistes de code ? Savez-vous s'il serait possible de comparer la quantité de Strongles émis par les deux groupes en tenant compte du temps de contact effectif et de l'élevage ou bien il va être obligatoire de simplifier ?
Je ne suis pas très compétente en biostatistiques et présente beaucoup de difficultés à prendre des initiatives…
Je vous remercie par avance !

Code : Tout sélectionner

> fs <- read.table("Fichierstrongles.txt", header = TRUE)
> str(fs)
'data.frame':   240 obs. of  6 variables:
 $ Prelevement  : int  1 1 1 1 1 1 1 1 1 1 ...
 $ Elevage      : Factor w/ 5 levels "a","b","c","d",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ Numero       : int  8937 8974 8984 6689 6773 6661 6658 6771 6649 8965 ...
 $ temointraitee: Factor w/ 2 levels "temoin","traitee": 2 2 2 2 2 2 2 2 2 1 ...
 $ TCE          : int  15 15 15 15 15 15 15 15 15 15 ...
 $ Strongles    : int  0 0 0 0 0 0 0 0 0 0 ...
> head(fs)
  Prelevement Elevage Numero temointraitee TCE Strongles
1           1       a   8937       traitee  15         0
2           1       a   8974       traitee  15         0
3           1       a   8984       traitee  15         0
4           1       a   6689       traitee  15         0
5           1       a   6773       traitee  15         0
6           1       a   6661       traitee  15         0

Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité