Bonjour,
J'ai un dataframe avec une ligne = un client. Ces clients ont de 2013 à 2018 un score pour chaque année entre 0 et 4 pour définir sa fidélité.
J'aimerais concaténer les scores de 2013 à 2017 et voir pour chacune des chaînes créées la probabilité du score de l'année suivante
Par exemple imaginons un client qui a comme score :
2013 : 2
2014 : 1
2015 : 0
2016 : 2
2017 : 3
2018 : 3
La chaîne donnerai donc 21023 et à partir de toutes les chaines 21023 a partir des clients voir la probabilité du score de l'année suivante. Grâce à ça j'aimerais pouvoir prédire le score de l'année 2019 avec les chaînes de 2014 à 2018. Les prédictions pourrait être fait avec une espérance
Exemple : sur toute les chaînes 21023 de 2013 à 2017, 10% passe à 0 en 2018, 5% passe à 1, 30% passe à 2, 40% passe a 3 et 15% passe à 4.
Donc pour les chaînes 21023 de 2014 à 2018 j'aimerais voir l’espérance 2,45 pour l'année 2019 en prédiction.
Je sais déjà comment vérifier la fiabilité après, je ne sais juste pas comment mettre en place ce système.
Désolé si je ne suis pas clair, n'hésitez pas a poser des questions et merci d'avance.
Cordialement, Raphaël.