Faker 2.0
Fonctionne sur les champs string seulement et ne supporte qu'en entrait les types float et integer
Le Faker 2.0 te permet de cibler une valeur selon ses caractéristiques réelles. Les paramètres de ciblage sont directement issus des métadonnées que tu as définies toi-même dans ton provider — ce sont exactement les mêmes clés que celles présentes dans l'objet metadata.
Le principe : chaque entrée d'un provider Faker 2.0 possède des métadonnées chiffrées qui décrivent ses propriétés. Au moment de la génération, le moteur recherche les entrées dont les métadonnées correspondent le mieux à tes critères, et retourne une valeur pondérée par proximité — plus une entrée est proche de ta cible, plus elle a de chances d'être choisie.
Exemple concret : tu génères des profils bancaires et tu veux que la banque associée soit cohérente avec le chiffre d'affaires de l'entreprise. Avec le Faker 2.0, tu cibles ca_annuel_milliards: 50 et le moteur te retourne une banque de taille réaliste — BNP Paribas ou Santander plutôt que JPMorgan Chase.
Plus une entrée est proche de ta cible, plus elle a de chances d'être choisie. Le moteur ne retourne pas toujours la même valeur — il pondère par proximité.
Configurer un provider Faker 2.0
Depuis l'interface Syntetica, ou par API / SDK (à venir).
Les métadonnées sont normalisées automatiquement par Syntetica à l'import du provider. Tu peux donc mélanger sans problème des valeurs d'échelles très différentes — effectifs: 184000 et solvabilite_cet1: 0.132 seront comparées équitablement.
Utiliser le Faker 2.0 dans un datamodel
Générer les métadonnées avec un llm (Claude , Chat GPT , Gemini ....)
Voici un prompt system pour vois aidez à générer vos métadonnées, insérer lors ce que vous démarrez un chat puis indiquer ce que vous voulez.
Une fois ton provider créé, tu peux l'utiliser dans n'importe quel champ de ton datamodel avec fakerType: faker2 et un bloc faker2 qui précise le provider ciblé et les dimensions souhaitées.
Recherche mono-dimensionnelle (mono-paramètre)
Tu cibles une seule métadonnée. Le moteur recherche les entrées dont cette valeur est la plus proche du champ désigné et retourne la valeur la plus cohérente.
Recherche multi-dimensionnelle (multi-paramètre)
Tu peux cibler plusieurs métadonnées simultanément. Le moteur calcule la distance dans l'espace de toutes les dimensions spécifiées — plus tu affines, plus le résultat est précis et cohérent.
Le dataset est généré de haut en bas, de gauche à droite. Un champ Faker 2.0 ne peut référencer dans son target que des champs déjà générés, c'est-à-dire déclarés avant lui dans le YAML.
Référencer un autre champ
La valeur cible peut être issue d'un autre champ du même enregistrement. C'est là que le Faker 2.0 révèle toute sa puissance : tu peux générer des données entièrement cohérentes entre elles sans aucune logique applicative.
Paramètres disponibles
Paramètre
Type
Obligatoire
Description
provider
string
✅
Nom du provider Faker 2.0 (faker_type_name)
target
object
✅
Métadonnées cibles avec leurs valeurs souhaitées
delta
float
❌
Tolérance de la recherche (défaut: 0.15). Plus élevé = résultats plus dispersés autour de la cible
{% hint style="danger" %} Ne pas combiner faker2 avec formula ou distribution sur le même champ. {% endhint %}
Last updated