Cette automatisation repose sur deux branches de traitement distinctes selon le type de fichier (image ou PDF), avec des actions IA adaptées à chaque cas.
→ Dans la branche image, une seule étape suffit : vous utilisez l’action Demander à une IA avec une source IA cloud public ou IA privée & sécurisée, en sélectionnant un modèle capable de lire des fichiers (OCR). L’IA analyse directement l’image (JPEG/PNG) et génère un JSON structuré, ensuite mappé vers les champs de destination.
→ Dans la branche PDF, le traitement se fait en deux étapes. D’abord, l’action Traiter un document avec Mistral AI OCR permet d’extraire le contenu du PDF et de le convertir en texte structuré (JSON exploitable). Ensuite, une seconde action Demander à une IA (cloud public ou privé & sécurisé) est utilisée pour interpréter ce JSON et effectuer le mapping vers les champs de la table.
En résumé :
Flux PDF → En 2 étapes
PDF → action OCR → champ texte → IA → JSON → mapping vers les champs
de destination
Flux image → En 1 étape
Image JPEG/PNG → analyse directe par l'IA → JSON structuré → mapping
vers les champs de destination
Avant de configurer vos prompts, prenez connaissance de ces règles : leur non-respect empêche le mapping automatique vers les champs de destination.
Clés simples et cohérentes
Sans accents, sans espaces, sans caractères spéciaux.
Format recommandé : camelCase ou snake_case.
Correspondance exacte entre la rédation du prompt dans le champ question et le mapping dans les champs de destination
Les noms des clés doivent être strictement identiques entre les clés
définies dans la Question et les clés renseignées dans
la configuration Propriétés JSON.
Toute différence empêchera l'affectation automatique des données.
Valeur vide en cas de doute
Ajoutez explicitement dans votre prompt :
« En cas de doute, laisser
la valeur vide. » Cette règle
réduit les erreurs d'interprétation
et améliore la stabilité du mapping.
Étape 1 → PDF : extraire le texte via OCR
Utilisez l'action "Traiter un document avec Mistral AI OCR" pour convertir le contenu du PDF en texte JSON exploitable.
1. Clé API
Renseignez votre clé d'API Mistral pour activer l'action OCR.
2. Fichier source
Sélectionnez le PDF stocké dans un champ pièce jointe de votre carnet.
3. Champ de destination
Stockez le résultat dans un champ de type texte,
ce texte JSON sera utilisé comme entrée pour l'étape suivante.
💡 Résultat : le contenu du PDF est converti en texte JSON et stocké dans votre champ, prêt à être traité par l'action IA à l'étape suivante.
Étape 2 → PDF : structurer le texte OCR avec l'IA
Une fois le texte OCR disponible dans un champ, utilisez l'action Demander à une IA pour extraire les informations clés et les enregistrer dans vos champs de destination.
1. Source IA
Sélectionnez la source adaptée à votre contexte :
IA privée & sécurisée · IA cloud public · Serveur dédié
2. Modèle
Choisissez un modèle capable d'analyser du texte long et de générer
un JSON structuré fiable · par exemple GPT-OSS 20B.
Cadre l'extraction, force un format structuré et évite les réponses narratives.
Vous êtes un système OCR expert capable d'extraire des informations à partir de justificatifs de dépense.
4. Question (prompt)
Le prompt doit contenir : le contexte, la variable du champ OCR, la tâche,
les clés JSON attendues et les règles de sortie.
Entrée :
Le texte ci-dessous correspond au contenu OCR extrait d'un justificatif de dépense.
Texte OCR :
$Extract_JSON_text_Pdf
Tâche :
Analyser uniquement ce texte et extraire les informations de dépense fiables.
Sortie :
Retourner UN SEUL objet JSON sur une seule ligne avec EXACTEMENT les clés suivantes :
description, details, total_incl_tax, subtotal_excl_tax, date_time, category
Règles des clés :
- description : nommer la dépense en 2 mots
- details : résumer le contexte en 5 mots
- total_incl_tax : montant total payé en euros (ex : 45.50)
- subtotal_excl_tax : montant hors TVA, toujours inférieur au total
- date_time : date et heure au format DD-MM-YYYY HH:mm
- category : choisir UNE catégorie parmi ⛽ Fuel, 🅿️ Parking, 🚧 Toll, 🍽️ Lunch, 🍷 Dinner, 🏨 Hotel, ☕ Coffee / Drink, 🚕 Taxi, 🚆 Train, ✈️ Flight, 🚇 Metro / Bus / RER, 🎟️ Invitation, 🎁 Gift, 🚗 Mileage, ✏️ Supplies, 🎓 Training, 🏡💻 Remote work allowance, Other
Règles générales :
1. Analyser uniquement le contenu visible du reçu.
2. Extraire uniquement les valeurs explicitement affichées.
3. Ne pas déduire, estimer ou calculer des valeurs manquantes.
4. En cas de doute, laisser la valeur vide ("").
5. Effectuer une seconde vérification avant de répondre.
6. La sortie doit être un JSON valide sur une seule ligne.
7. Ne pas ajouter de commentaires, d'explications ou de clés supplémentaires.
Structure du prompt : contexte → variable OCR ($champ_texte)
→ tâche → clés JSON avec règles → règles générales de sortie (JSON valide,
une seule ligne, pas de commentaires).
5. Format de réponse
Sélectionnez JSON avec champs de destination.
Chaque propriété JSON sera automatiquement injectée dans le champ correspondant.
6. Mapping des propriétés JSON
Associez chaque clé JSON au champ de destination correspondant :
Vous êtes un système OCR expert capable d'extraire des informations à partir de justificatifs de dépense.
4. Question (prompt)
Entrée :
Le fichier joint est une image d'un justificatif de dépense.
Tâche :
Extraire UNIQUEMENT les informations de dépense fiables visibles sur le reçu.
Sortie :
Retourner UN SEUL objet JSON sur une seule ligne avec EXACTEMENT les clés suivantes :
description, details, total_incl_tax, subtotal_excl_tax, date_time, category
Règles des clés :
- description : nommer la dépense en 2 mots
- details : résumer le contexte en 5 mots
- total_incl_tax : montant total payé en euros (ex : 45.50)
- subtotal_excl_tax : montant hors TVA, toujours inférieur au total
- date_time : date et heure au format DD-MM-YYYY HH:mm
- category : choisir UNE catégorie parmi ⛽ Fuel, 🅿️ Parking, 🚧 Toll, 🍽️ Lunch, 🍷 Dinner, 🏨 Hotel, ☕ Coffee / Drink, 🚕 Taxi, 🚆 Train, ✈️ Flight, 🚇 Metro / Bus / RER, 🎟️ Invitation, 🎁 Gift, 🚗 Mileage, ✏️ Supplies, 🎓 Training, 🏡💻 Remote work allowance, Other
Règles générales :
1. Analyser uniquement le contenu visible du reçu.
2. Extraire uniquement les valeurs explicitement affichées.
3. Ne pas déduire, estimer ou calculer des valeurs manquantes.
4. En cas de doute, laisser la valeur vide ("").
5. Effectuer une seconde vérification avant de répondre.
6. La sortie doit être un JSON valide sur une seule ligne.
7. Ne pas ajouter de commentaires, d'explications ou de clés supplémentaires.
Structure du prompt : contexte (fichier image)
→ tâche → clés JSON avec règles → règles générales de sortie.
Pas de variable OCR ici — le modèle analyse directement la pièce jointe.
5. Pièce jointe
Sélectionnez le champ pièce jointe contenant l'image à analyser.
Ce champ permet au modèle d'accéder directement au fichier sans
étape OCR intermédiaire.
6. Format de réponse
Sélectionnez JSON avec champs de destination.
7. Mapping des propriétés JSON
Même structure que pour le flux PDF :
Propriété JSON
Champ de destination
description
Description
details
Details
date_time
Date & Time
total_incl_tax
Total (incl. tax)
subtotal_excl_tax
Subtotal (excl. tax)
category
Category
Méthodologie : un scénario avec branches conditionnelles .PDF & image
Pour un scénario robuste, utilisez une condition qui oriente automatiquement le traitement selon le type de fichier reçu.
Déclencheur
Ajout ou modification d'un champ pièce jointe (PDF ou image).
Condition
Si le nom du fichier contient .pdf → branche PDF.
Sinon → branche image.
Branche PDF
Action OCR (PDF → texte JSON) → Action Demander à une IA (texte → JSON)
→ Mapping vers les champs de destination.
Branche image
Action Demander à une IA avec pièce jointe directe (Mistral Small 3.2
ou Qwen 2.5 VL 72B) → JSON → Mapping vers les champs de destination.