Les jetons sont les unités qui mesurent l’utilisation du modèle d’IA. Votre entrée (prompt) et la réponse de l’IA (complétion) consomment des jetons. Considérez les jetons comme environ 3/4 d’un mot en français.Exemple : “Bonjour, comment allez-vous aujourd’hui ?” ≈ 6 jetons
Tous les prix des jetons sont listés en USD par 1 million de jetons.
Les modèles suivants sont actuellement disponibles dans WonkaChat. Pour des informations de tarification spécifiques, veuillez contacter notre équipe de Support Commercial.
Les jetons sont comptés pour l’entrée (votre prompt + instructions de l’agent) et la sortie (la réponse de l’IA).Estimation approximative : 1 jeton ≈ 0.75 mots françaisExemple de conversation :
Votre question : “Résumez ce document” (3 jetons)
Contenu du document : 2,000 mots (≈2,666 jetons)
Résumé de l’IA : 200 mots (≈267 jetons)
Total : ~2,936 jetons consommés
Quel modèle devrais-je utiliser ?
Commencez ici :
La plupart des équipes : GPT-4o Mini - meilleur rapport qualité-prix
Axé sur la vitesse : Gemini 2.5 Flash ou Claude Haiku 4.5
Tâches complexes : Claude Sonnet 4.6 ou GPT-4o
Capacité maximale : GPT-5.2 ou Claude Opus 4.5
Testez avec votre cas d’usage réel pour trouver le bon équilibre.
Puis-je changer de modèle ?
Oui ! Vous pouvez configurer différents modèles pour différents agents. Utilisez les modèles coûteux uniquement là où la qualité compte le plus.Stratégie :
Destiné aux clients : Modèles premium ou standard
Outils internes : Modèles économiques
Tests : Modèles économiques
Comment la tarification est-elle calculée ?
La tarification des jetons est basée sur :
Jetons d’entrée : Votre prompt + instructions système + contexte
Jetons de sortie : La réponse générée par l’IA
Différents modèles ont des tarifications différentes pour l’entrée vs la sortie. Pour des détails de tarification spécifiques, veuillez contacter notre équipe de Support Commercial.
Quelle est la différence entre les versions de modèles ?
Les versions plus récentes (comme Claude Sonnet 4.6 vs 4.5, ou GPT-5.2 vs GPT-5) offrent généralement :
Capacités de raisonnement améliorées
Meilleur suivi d’instructions
Précision accrue
Parfois une meilleure tarification
Les variantes “latest” (comme Mistral Large Latest) se mettent automatiquement à jour vers la version la plus récente.
Les modèles en aperçu sont-ils stables pour la production ?
Les modèles en aperçu (comme la série Gemini 3) sont :
De pointe mais peuvent avoir des changements
Idéaux pour tester de nouvelles capacités
Non recommandés pour les charges de travail de production critiques
Pour une utilisation en production, privilégiez les versions stables comme GPT-4o, Claude Sonnet 4.6, ou la série Gemini 2.5.