Configurer "Action IA · OCR (PDF & images)" – TimeTonic v7

Cette automatisation repose sur deux branches de traitement distinctes selon le type de fichier (image ou PDF), avec des actions IA adaptées à chaque cas.

→ Dans la branche image, une seule étape suffit : vous utilisez l’action Demander à une IA avec une source IA cloud public ou IA privée & sécurisée, en sélectionnant un modèle capable de lire des fichiers (OCR). L’IA analyse directement l’image (JPEG/PNG) et génère un JSON structuré, ensuite mappé vers les champs de destination.

→ Dans la branche PDF, le traitement se fait en deux étapes.
D’abord, l’action Traiter un document avec Mistral AI OCR permet d’extraire le contenu du PDF et de le convertir en texte structuré (JSON exploitable).
Ensuite, une seconde action Demander à une IA (cloud public ou privé & sécurisé) est utilisée pour interpréter ce JSON et effectuer le mapping vers les champs de la table.

En résumé :

Flux PDF → En 2 étapes

PDF → action OCR → champ texte → IA → JSON → mapping vers les champs de destination

Flux image → En 1 étape

Image JPEG/PNG → analyse directe par l'IA → JSON structuré → mapping vers les champs de destination

Sommaire

Règles obligatoires pour un JSON exploitable Étape 1 → PDF : extraire le texte via OCR Étape 2 → PDF : structurer le texte OCR avec l'IA Étape → Image (.png / .jpeg) : analyse directe

Méthodologie : 1 scénario avec branches conditionnelles PDF & image

Règles obligatoires pour un JSON exploitable

Avant de configurer vos prompts, prenez connaissance de ces règles : leur non-respect empêche le mapping automatique vers les champs de destination.

Clés simples et cohérentes

Sans accents, sans espaces, sans caractères spéciaux. Format recommandé : camelCase ou snake_case.

Correspondance exacte entre la rédation du prompt dans le champ question et le mapping dans les champs de destination

Les noms des clés doivent être strictement identiques entre les clés définies dans la Question et les clés renseignées dans la configuration Propriétés JSON. Toute différence empêchera l'affectation automatique des données.

Valeur vide en cas de doute

Ajoutez explicitement dans votre prompt : « En cas de doute, laisser la valeur vide. » Cette règle réduit les erreurs d'interprétation et améliore la stabilité du mapping.

Étape 1 → PDF : extraire le texte via OCR

Utilisez l'action "Traiter un document avec Mistral AI OCR" pour convertir le contenu du PDF en texte JSON exploitable.

1. Clé API

Renseignez votre clé d'API Mistral pour activer l'action OCR.

2. Fichier source

Sélectionnez le PDF stocké dans un champ pièce jointe de votre carnet.

3. Champ de destination

Stockez le résultat dans un champ de type texte, ce texte JSON sera utilisé comme entrée pour l'étape suivante.

💡 Résultat : le contenu du PDF est converti en texte JSON et stocké dans votre champ, prêt à être traité par l'action IA à l'étape suivante.

Étape 2 → PDF : structurer le texte OCR avec l'IA

Une fois le texte OCR disponible dans un champ, utilisez l'action Demander à une IA pour extraire les informations clés et les enregistrer dans vos champs de destination.

1. Source IA

Sélectionnez la source adaptée à votre contexte : IA privée & sécurisée · IA cloud public · Serveur dédié

2. Modèle

Choisissez un modèle capable d'analyser du texte long et de générer un JSON structuré fiable · par exemple GPT-OSS 20B.

Voir les modèles disponibles ➔

3. Rôle de l'IA

Cadre l'extraction, force un format structuré et évite les réponses narratives.

Vous êtes un système OCR expert capable d'extraire des informations à partir de justificatifs de dépense.

4. Question (prompt)

Le prompt doit contenir : le contexte, la variable du champ OCR, la tâche, les clés JSON attendues et les règles de sortie.

Entrée :
Le texte ci-dessous correspond au contenu OCR extrait d'un justificatif de dépense.

Texte OCR :
$Extract_JSON_text_Pdf

Tâche :
Analyser uniquement ce texte et extraire les informations de dépense fiables.

Sortie :
Retourner UN SEUL objet JSON sur une seule ligne avec EXACTEMENT les clés suivantes :
description, details, total_incl_tax, subtotal_excl_tax, date_time, category

Règles des clés :
- description : nommer la dépense en 2 mots
- details : résumer le contexte en 5 mots
- total_incl_tax : montant total payé en euros (ex : 45.50)
- subtotal_excl_tax : montant hors TVA, toujours inférieur au total
- date_time : date et heure au format DD-MM-YYYY HH:mm
- category : choisir UNE catégorie parmi ⛽ Fuel, 🅿️ Parking, 🚧 Toll, 🍽️ Lunch, 🍷 Dinner, 🏨 Hotel, ☕ Coffee / Drink, 🚕 Taxi, 🚆 Train, ✈️ Flight, 🚇 Metro / Bus / RER, 🎟️ Invitation, 🎁 Gift, 🚗 Mileage, ✏️ Supplies, 🎓 Training, 🏡💻 Remote work allowance, Other

Règles générales :
1. Analyser uniquement le contenu visible du reçu.
2. Extraire uniquement les valeurs explicitement affichées.
3. Ne pas déduire, estimer ou calculer des valeurs manquantes.
4. En cas de doute, laisser la valeur vide ("").
5. Effectuer une seconde vérification avant de répondre.
6. La sortie doit être un JSON valide sur une seule ligne.
7. Ne pas ajouter de commentaires, d'explications ou de clés supplémentaires.

Structure du prompt : contexte → variable OCR ($champ_texte) → tâche → clés JSON avec règles → règles générales de sortie (JSON valide, une seule ligne, pas de commentaires).

5. Format de réponse

Sélectionnez JSON avec champs de destination. Chaque propriété JSON sera automatiquement injectée dans le champ correspondant.

6. Mapping des propriétés JSON

Associez chaque clé JSON au champ de destination correspondant :

Propriété JSON	Champ de destination
`description`	Description
`details`	Details
`date_time`	Date & Time
`total_incl_tax`	Total (incl. tax)
`subtotal_excl_tax`	Subtotal (excl. tax)
`category`	Category

Étape — Image (.png / .jpeg) : analyse directe par l'IA

Pour les fichiers image, aucune étape OCR intermédiaire n'est nécessaire. L'IA analyse directement la pièce jointe et génère un JSON structuré.

1. Source IA

Sélectionnez la source adaptée à votre contexte : IA privée & sécurisée · IA cloud public · Serveur dédié

2. Modèle

Choisissez un modèle supportant l'analyse d'images (vision / OCR intégré) avec le champ pièce jointe activé dans la configuration :

Mistral Small 3.2 24B 📎 Qwen 2.5 VL 72B 📎

Voir les modèles disponibles ➔

3. Rôle de l'IA

Vous êtes un système OCR expert capable d'extraire des informations à partir de justificatifs de dépense.

4. Question (prompt)

Entrée :
Le fichier joint est une image d'un justificatif de dépense.

Tâche :
Extraire UNIQUEMENT les informations de dépense fiables visibles sur le reçu.

Sortie :
Retourner UN SEUL objet JSON sur une seule ligne avec EXACTEMENT les clés suivantes :
description, details, total_incl_tax, subtotal_excl_tax, date_time, category

Règles des clés :
- description : nommer la dépense en 2 mots
- details : résumer le contexte en 5 mots
- total_incl_tax : montant total payé en euros (ex : 45.50)
- subtotal_excl_tax : montant hors TVA, toujours inférieur au total
- date_time : date et heure au format DD-MM-YYYY HH:mm
- category : choisir UNE catégorie parmi ⛽ Fuel, 🅿️ Parking, 🚧 Toll, 🍽️ Lunch, 🍷 Dinner, 🏨 Hotel, ☕ Coffee / Drink, 🚕 Taxi, 🚆 Train, ✈️ Flight, 🚇 Metro / Bus / RER, 🎟️ Invitation, 🎁 Gift, 🚗 Mileage, ✏️ Supplies, 🎓 Training, 🏡💻 Remote work allowance, Other

Règles générales :
1. Analyser uniquement le contenu visible du reçu.
2. Extraire uniquement les valeurs explicitement affichées.
3. Ne pas déduire, estimer ou calculer des valeurs manquantes.
4. En cas de doute, laisser la valeur vide ("").
5. Effectuer une seconde vérification avant de répondre.
6. La sortie doit être un JSON valide sur une seule ligne.
7. Ne pas ajouter de commentaires, d'explications ou de clés supplémentaires.

Structure du prompt : contexte (fichier image) → tâche → clés JSON avec règles → règles générales de sortie. Pas de variable OCR ici — le modèle analyse directement la pièce jointe.

5. Pièce jointe

Sélectionnez le champ pièce jointe contenant l'image à analyser. Ce champ permet au modèle d'accéder directement au fichier sans étape OCR intermédiaire.

6. Format de réponse

Sélectionnez JSON avec champs de destination.

7. Mapping des propriétés JSON

Même structure que pour le flux PDF :

Propriété JSON	Champ de destination
`description`	Description
`details`	Details
`date_time`	Date & Time
`total_incl_tax`	Total (incl. tax)
`subtotal_excl_tax`	Subtotal (excl. tax)
`category`	Category

Méthodologie : un scénario avec branches conditionnelles .PDF & image

Pour un scénario robuste, utilisez une condition qui oriente automatiquement le traitement selon le type de fichier reçu.

Déclencheur

Ajout ou modification d'un champ pièce jointe (PDF ou image).

Condition

Si le nom du fichier contient .pdf → branche PDF. Sinon → branche image.

Branche PDF

Action OCR (PDF → texte JSON) → Action Demander à une IA (texte → JSON) → Mapping vers les champs de destination.

Branche image

Action Demander à une IA avec pièce jointe directe (Mistral Small 3.2 ou Qwen 2.5 VL 72B) → JSON → Mapping vers les champs de destination.

Recherche

Laissez-vous guider !

Configurer "Action IA · OCR (PDF & images)"

Règles obligatoires pour un JSON exploitable

Étape 1 → PDF : extraire le texte via OCR

Étape 2 → PDF : structurer le texte OCR avec l'IA

Étape — Image (.png / .jpeg) : analyse directe par l'IA

Méthodologie : un scénario avec branches conditionnelles .PDF & image