Tarification des jetons - WonkaChat Wiki

Que sont les jetons ?

Les jetons sont les unités qui mesurent l’utilisation du modèle d’IA. Votre entrée (prompt) et la réponse de l’IA (complétion) consomment des jetons. Considérez les jetons comme environ 3/4 d’un mot en français.Exemple : “Bonjour, comment allez-vous aujourd’hui ?” ≈ 6 jetons

Tous les prix des jetons sont listés en USD par 1 million de jetons.

Modèles disponibles dans WonkaChat

Les modèles suivants sont actuellement disponibles dans WonkaChat. Pour des informations de tarification spécifiques, veuillez contacter notre équipe de Support Commercial.

Par fournisseur
Par cas d'usage
Comparaison des modèles

Modèles OpenAI

Série GPT-5 (Derniers)

Modèle	Idéal pour
GPT-5.2	IA généraliste la plus avancée, performances de pointe
GPT-5	Réponses de haute qualité, raisonnement complexe

La série GPT-5 représente les dernières capacités d’IA avec une qualité de raisonnement et de génération améliorée.

Série GPT-4o

Modèle	Idéal pour
GPT-4o Mini	Tâches générales, meilleur rapport qualité-prix pour la plupart des cas
GPT-4o	Réponses de haute qualité, raisonnement complexe

GPT-4o Mini est notre choix le plus populaire - excellent équilibre entre qualité et rapport coût-efficacité.

Modèles Anthropic Claude

Série Claude Sonnet

Modèle	Idéal pour
Claude Sonnet 4.6	Dernière version, performances améliorées et suivi d’instructions
Claude Sonnet 4.5	Performances équilibrées pour les tâches complexes
Claude Sonnet 4	Raisonnement complexe, analyse détaillée

Les modèles Claude Sonnet sont réputés pour suivre avec précision les instructions complexes et nuancées.

Modèles Claude spécialisés

Modèle	Idéal pour
Claude Haiku 4.5	Tâches rapides et efficaces avec délai d’exécution rapide
Claude Opus 4.5	Capacité maximale, tâches les plus complexes et critiques

Claude Haiku est optimisé pour la vitesse, tandis qu’Opus offre la plus haute qualité pour le travail critique.

Modèles Google Gemini

Série Gemini 3 (Aperçu)

Modèle	Idéal pour
Gemini 3 Pro Preview	Raisonnement complexe de nouvelle génération (aperçu)
Gemini 3 Flash Preview	Traitement rapide de nouvelle génération (aperçu)

Les modèles Gemini 3 sont actuellement en aperçu. Les fonctionnalités et la disponibilité peuvent changer.

Série Gemini 2.5

Modèle	Idéal pour
Gemini 2.5 Pro	Raisonnement complexe, tâches analytiques
Gemini 2.5 Flash	Tâches générales rapides et rentables

Gemini 2.5 Flash offre d’excellentes performances pour les opérations à haut volume avec une tarification compétitive.

Modèles Mistral AI

Modèle	Idéal pour
Mistral Large Latest	Tâches avancées nécessitant une capacité élevée
Mistral Medium Latest	Performances équilibrées pour usage professionnel général

Les modèles Mistral sont automatiquement mis à jour vers les dernières versions, vous garantissant toujours l’accès aux améliorations.

Guide de comparaison rapide

Niveau d’entrée (Économique)

Quand utiliser : Volume élevé, tâches simples, outils internes

Modèle	Points forts
GPT-4o Mini	Meilleur rapport qualité-prix global, qualité fiable
Gemini 2.5 Flash	Très rentable, rapide
Claude Haiku 4.5	Délai d’exécution rapide, efficace

Niveau intermédiaire (Standard)

Quand utiliser : Tâches professionnelles générales, contenu destiné aux clients

Modèle	Points forts
GPT-4o	Haute qualité, raisonnement complexe
Claude Sonnet 4.6	Excellent suivi d’instructions
Gemini 2.5 Pro	Solides capacités analytiques
Mistral Large Latest	Performances générales avancées

Premium (Avancé)

Quand utiliser : Décisions critiques, analyses complexes, qualité maximale

Modèle	Points forts
GPT-5.2	Capacités d’IA de pointe
Claude Opus 4.5	Précision et qualité maximales
Gemini 3 Pro Preview	Raisonnement de nouvelle génération

Par type de charge de travail

Opérations à volume élevé : → GPT-4o Mini, Gemini 2.5 FlashDestiné aux clients : → GPT-4o, Claude Sonnet 4.6, Mistral Large LatestAnalyse interne : → Gemini 2.5 Pro, Claude Sonnet 4.5, GPT-4oTâches critiques : → GPT-5.2, Claude Opus 4.5, Claude Sonnet 4.6

Questions fréquemment posées

Comment les jetons sont-ils comptés ?

Les jetons sont comptés pour l’entrée (votre prompt + instructions de l’agent) et la sortie (la réponse de l’IA).Estimation approximative : 1 jeton ≈ 0.75 mots françaisExemple de conversation :

Votre question : “Résumez ce document” (3 jetons)
Contenu du document : 2,000 mots (≈2,666 jetons)
Résumé de l’IA : 200 mots (≈267 jetons)
Total : ~2,936 jetons consommés

Quel modèle devrais-je utiliser ?

Commencez ici :

La plupart des équipes : GPT-4o Mini - meilleur rapport qualité-prix
Axé sur la vitesse : Gemini 2.5 Flash ou Claude Haiku 4.5
Tâches complexes : Claude Sonnet 4.6 ou GPT-4o
Capacité maximale : GPT-5.2 ou Claude Opus 4.5

Testez avec votre cas d’usage réel pour trouver le bon équilibre.

Puis-je changer de modèle ?

Oui ! Vous pouvez configurer différents modèles pour différents agents. Utilisez les modèles coûteux uniquement là où la qualité compte le plus.Stratégie :

Destiné aux clients : Modèles premium ou standard
Outils internes : Modèles économiques
Tests : Modèles économiques

Comment la tarification est-elle calculée ?

La tarification des jetons est basée sur :

Jetons d’entrée : Votre prompt + instructions système + contexte
Jetons de sortie : La réponse générée par l’IA

Différents modèles ont des tarifications différentes pour l’entrée vs la sortie. Pour des détails de tarification spécifiques, veuillez contacter notre équipe de Support Commercial.

Quelle est la différence entre les versions de modèles ?

Les versions plus récentes (comme Claude Sonnet 4.6 vs 4.5, ou GPT-5.2 vs GPT-5) offrent généralement :

Capacités de raisonnement améliorées
Meilleur suivi d’instructions
Précision accrue
Parfois une meilleure tarification

Les variantes “latest” (comme Mistral Large Latest) se mettent automatiquement à jour vers la version la plus récente.

Les modèles en aperçu sont-ils stables pour la production ?

Les modèles en aperçu (comme la série Gemini 3) sont :

De pointe mais peuvent avoir des changements
Idéaux pour tester de nouvelles capacités
Non recommandés pour les charges de travail de production critiques

Pour une utilisation en production, privilégiez les versions stables comme GPT-4o, Claude Sonnet 4.6, ou la série Gemini 2.5.

Besoin d’aide pour choisir ?

Contactez notre équipe

Pas sûr des modèles qui correspondent à votre cas d’usage ? Notre équipe de Support Commercial peut :

Analyser vos besoins
Recommander le mix de modèles optimal
Fournir une tarification détaillée pour votre volume attendu
Vous aider à tester différentes options

Obtenir des recommandations de modèles

​Que sont les jetons ?

​Modèles disponibles dans WonkaChat

​Modèles OpenAI

​Modèles Anthropic Claude

​Modèles Google Gemini

​Modèles Mistral AI

​Choisir par type de tâche

​Guide de comparaison rapide

​Niveau d’entrée (Économique)

​Niveau intermédiaire (Standard)

​Premium (Avancé)

​Par type de charge de travail

​Questions fréquemment posées

​Besoin d’aide pour choisir ?

Contactez notre équipe

Que sont les jetons ?

Modèles disponibles dans WonkaChat

Modèles OpenAI

Modèles Anthropic Claude

Modèles Google Gemini

Modèles Mistral AI

Choisir par type de tâche

Guide de comparaison rapide

Niveau d’entrée (Économique)

Niveau intermédiaire (Standard)

Premium (Avancé)

Par type de charge de travail

Questions fréquemment posées

Besoin d’aide pour choisir ?