Répartition / Distribution

Fonctionne sur le champs string uniquement !

La répartition / distribution permet d'établir la proportion d’apparition des valeurs de type numérique dans la colonne. Exemple j'ai une colonne contenant le sexe des individus ["homme", "femme", "autre"] , je peux donc choisir que 30% du contenue de ma colonne sera la valeur "homme" , 60% "femme" et 10% "autre". Cela permet donc de répartir des valeurs souhaitées dans les bonnes proportions

La saisonnalité permet de créer dans une plage de date, des cycles plus ou moins précis se répétant. Pour créer une saisonnalité il faut une variable de type date et une variable de type numérique (int, float) . Pour cette fonctionnalité l'accent à été mis sur une ressemblance avec la réalité.

Il est possible de configurer 2 paramètres :

  1. Préciser la proportion d'apparition de chaque valeur dans le tableau.

  2. Lister les valeurs de type string (chaînes de caractères) qui apparaîtrons dans la colonne

Créer une répartition

Pour cela il suffit d'ajouter le paramètre distribution qui est un tableau contenant la part de présence dans la colonne. Chaque chiffre du tableau vas de 0 à 1.

Il suffit de le coupler avec allowedValues qui contiendra lui les valeurs à afficher

- fieldName : qualitative_test_repartion
    type : string
    distribution : [0.2, 0.5, 0.3]
    rules: 
      allowedValues : ["python","C++","java"]
 # python = 20% , C++ =  50% et java = 30%

Last updated