Patern

Fonctionne sur le champs id uniquement !

Le Pattern : Contrôler la Répétition des IDs

À quoi ça sert ?

Un pattern permet de générer des données logiques en évitant les inécohérences. → Exemple : Un même client (ID) peut passer plusieurs commandes, pas une seule aléatoire.


Comment ?

  • Nombre de répétitions max : Combien de fois un ID peut apparaître (ex: 15 fois max).

  • Cycles : 1 cycle = 1 ligne générée (ex: chaque commande = 1 cycle).

Exemple :

  • Si un ID utilisateur a 15 répétitions, il peut apparaître 15 fois max dans vos données.

  • Si vos données ont 100 cycles, cet ID sera présent au maximum 15 fois sur ces 100 lignes.


Pourquoi c'est utile ?

  • Simule des clients récurrents (ex: un seul client passe 15 commandes).

  • Évite les données trop dispersées (ex: des clients qui n’achètent qu’une fois alors qu’ils devraient revenir).


En résumé : Un pattern fixe des règles de répétition pour rendre les données réalistes et contrôlées.

Il est très utiliser avec les workflows

pattern : type 
pattern_max_cycle : 15
pattern_part_of_dataset : 0.7

Il est possible de configurer 2 paramètres :

  1. Préciser le nombre la présence maximal dans lequelle ce pattern peux etre présent ex 3 fois.

  2. Choisir la proportion du dataset dans laquelle utiliser cet efet de pattern le pattern

pattern : type 
pattern_max_cycle : 15
pattern_part_of_dataset : 0.7

Créer un pattern

le paramètre pattern précise qu'on utilise pattern dans le champ de type id

le paramètre pattern_max_cycle précise jusqu'a combien de fois un id peut être présent dans le dataset

le paramètre pattern_part_of_dataset défini la proportion du dataset utilisant le système de pattern.

SI le type identifiant n'est pas claire -> identifiant


- fieldName: identifiant
    type: id
    pattern : type 
    pattern_max_cycle : 15
    pattern_part_of_dataset : 0.7

    rules:
      len: 15
      includeLetters: true
      includeNumbers: true
      includeSpecialChars: false

Last updated