Répartition / Distribution
Fonctionne sur le champs string uniquement !
La répartition / distribution permet d'établir la proportion d’apparition des valeurs de type numérique dans la colonne. Exemple j'ai une colonne contenant le sexe des individus ["homme", "femme", "autre"] , je peux donc choisir que 30% du contenue de ma colonne sera la valeur "homme" , 60% "femme" et 10% "autre". Cela permet donc de répartir des valeurs souhaitées dans les bonnes proportions
La saisonnalité permet de créer dans une plage de date, des cycles plus ou moins précis se répétant. Pour créer une saisonnalité il faut une variable de type date et une variable de type numérique (int, float) . Pour cette fonctionnalité l'accent à été mis sur une ressemblance avec la réalité.
Il est possible de configurer 2 paramètres :
Préciser la proportion d'apparition de chaque valeur dans le tableau.
Lister les valeurs de type string (chaînes de caractères) qui apparaîtrons dans la colonne
Créer une répartition
Pour cela il suffit d'ajouter le paramètre distribution qui est un tableau contenant la part de présence dans la colonne. Chaque chiffre du tableau vas de 0 à 1.
Il suffit de le coupler avec allowedValues qui contiendra lui les valeurs à afficher
- fieldName : qualitative_test_repartion
type : string
distribution : [0.2, 0.5, 0.3]
rules:
allowedValues : ["python","C++","java"]
# python = 20% , C++ = 50% et java = 30%
Last updated