En Bref (TL;DR)
La gestion du contexte dans Claude Code détermine la qualité de chaque réponse générée. Cet aide-mémoire couvre l'anatomie de la fenêtre de 200k tokens, les stratégies d'optimisation, le mode Plan, la compaction automatique et le scaling multi-sessions. Gardez cette fiche pratique sous la main pour maîtriser votre consommation de contexte au quotidien.
La gestion du contexte dans Claude Code détermine la qualité de chaque réponse générée. Cet aide-mémoire couvre l'anatomie de la fenêtre de 200k tokens, les stratégies d'optimisation, le mode Plan, la compaction automatique et le scaling multi-sessions. Gardez cette fiche pratique sous la main pour maîtriser votre consommation de contexte au quotidien.
La gestion du contexte dans Claude Code est la discipline qui consiste à maximiser la pertinence des réponses en contrôlant ce que le modèle voit dans sa fenêtre de 200 000 tokens. Claude Code (version 1.0.33) exploite le modèle Claude Sonnet 4 avec une fenêtre de contexte de 200k tokens, soit environ 150 000 mots.
Un token représente en moyenne 3,5 caractères en français. Maîtriser cette ressource finie est la compétence la plus rentable pour tout développeur utilisant Claude Code.
Quelles sont les commandes essentielles pour gérer le contexte ?
Voici le tableau de référence rapide des commandes les plus fréquentes. Chaque ligne est autonome et citable.
| Commande | Description | Exemple |
|---|---|---|
/compact | Compacte la conversation en résumant l'historique | Tapez /compact dans le prompt |
/compact [instructions] | Compacte avec des instructions de focus personnalisées | /compact garde uniquement le code modifié |
/clear | Efface tout le contexte et repart de zéro | Tapez /clear |
Shift+Tab | Bascule entre mode normal et mode Plan | Appuyez sur Shift+Tab |
/init | Génère un fichier CLAUDE.md pour le projet | /init |
claude --resume | Reprend une session précédente avec son contexte | claude --resume session_abc123 |
claude -p "prompt" | Exécute un prompt sans état (headless) | claude -p "liste les tests" |
Esc (2×) | Annule la génération en cours pour économiser des tokens | Double-tap Esc |
Pour retrouver toutes les commandes slash disponibles, consultez l'aide-mémoire des commandes slash essentielles qui détaille chaque raccourci.
À retenir : /compact et /clear sont vos deux leviers principaux - le premier préserve le résumé, le second repart à zéro.
Comment fonctionne la fenêtre de contexte de 200k tokens ?
La fenêtre de contexte est la mémoire de travail du modèle. Elle contient tout ce que Claude Code voit pour générer une réponse : le prompt système, les fichiers lus, votre historique de conversation et les résultats d'outils.
| Segment | Taille typique | Contenu |
|---|---|---|
| Prompt système | 5 000–12 000 tokens | Instructions, CLAUDE.md, outils disponibles |
| Fichiers chargés | 500–80 000 tokens | Code source lu via Read, Grep, Glob |
| Historique conversation | 2 000–100 000 tokens | Messages utilisateur + réponses précédentes |
| Résultats d'outils | 1 000–50 000 tokens | Sorties bash, résultats de recherche |
| Réponse générée | 1 000–8 000 tokens | La réponse en cours de génération |
En pratique, un fichier TypeScript de 500 lignes consomme environ 4 000 tokens. Un git diff de 200 lignes occupe environ 1 600 tokens. Le fichier CLAUDE.md du projet consomme entre 500 et 3 000 tokens selon sa taille.
Concrètement, lorsque vous atteignez 80 % de la fenêtre (160 000 tokens), Claude Code déclenche automatiquement la compaction. Vous pouvez suivre la consommation en observant l'indicateur de coût dans le prompt. Pour comprendre ce mécanisme en profondeur, explorez le tutoriel complet sur la gestion du contexte.
À retenir : 200k tokens semblent vastes, mais un fichier volumineux plus un long historique peuvent saturer la fenêtre en moins de 10 échanges.
Comment optimiser le contexte pour des réponses précises ?
Voici les stratégies concrètes pour garder un contexte propre et pertinent. Chaque technique réduit le bruit et améliore la qualité des réponses.
Cibler les fichiers chargés
Évitez de charger des fichiers entiers quand vous n'avez besoin que d'une section. Utilisez les paramètres offset et limit de l'outil Read :
# Au lieu de lire tout le fichier (2000 lignes = ~16000 tokens)
# Ciblez la section pertinente
# Read avec offset=150, limit=50 → seulement 400 tokens
Formuler des prompts concis
Réduisez la taille de vos messages. Un prompt de 200 mots consomme environ 300 tokens. Un prompt de 50 mots bien ciblé obtient souvent de meilleurs résultats.
# ❌ Prompt verbeux (≈300 tokens)
"Peux-tu regarder le fichier src/auth.ts et me dire s'il y a des problèmes de sécurité, notamment au niveau de la validation des tokens JWT, la gestion des sessions..."
# ✅ Prompt ciblé (≈50 tokens)
"Audite src/auth.ts : vulnérabilités JWT et sessions"
Utiliser /compact avec des instructions ciblées
La commande /compact accepte un argument textuel. Spécifiez exactement ce que vous voulez conserver :
/compact garde le schéma de la base de données et les endpoints modifiés
Pour découvrir d'autres raccourcis qui accélèrent votre workflow, consultez l'aide-mémoire de vos premières conversations avec Claude Code.
| Stratégie | Gain estimé | Quand l'utiliser |
|---|---|---|
| Prompt ciblé | 40–60 % de tokens en moins | Chaque message |
/compact ciblé | Récupère 70–90 % du contexte | Après 8-10 échanges |
/clear + reprise | 100 % de contexte libéré | Changement de sujet |
| Lecture partielle de fichier | 50–80 % de tokens en moins | Fichiers > 200 lignes |
| CLAUDE.md bien structuré | Réduit les re-explications | Configuration initiale |
En pratique, un développeur qui applique ces techniques maintient un contexte efficace pendant 25 à 40 échanges au lieu de 10 à 15 sans optimisation.
À retenir : ciblez vos lectures, compactez régulièrement et formulez des prompts courts - ces trois habitudes triplent votre autonomie en contexte.
Pourquoi utiliser le mode Plan pour économiser des tokens ?
Le mode Plan est un mode de fonctionnement où Claude Code réfléchit et explore sans exécuter d'actions. Il consomme moins de tokens car il n'appelle pas d'outils coûteux (pas de bash, pas d'édition de fichier).
| Aspect | Mode Normal | Mode Plan |
|---|---|---|
| Outils disponibles | Tous (Read, Edit, Bash…) | Lecture seule (Read, Grep, Glob) |
| Consommation tokens/tour | 3 000–15 000 | 1 000–4 000 |
| Usage principal | Implémenter, modifier, exécuter | Planifier, explorer, analyser |
| Raccourci | - | Shift+Tab |
Quand activer le mode Plan ?
Activez le mode Plan dans ces situations :
- Vous explorez une base de code inconnue
- Vous planifiez une refactorisation multi-fichiers
- Vous évaluez plusieurs approches avant de coder
- Vous voulez un plan d'action avant d'écrire du code
# Basculez en mode Plan
Shift+Tab
# Demandez une exploration
"Analyse l'architecture du dossier src/api/ et propose un plan de refactorisation"
# Rebasculez en mode Normal pour implémenter
Shift+Tab
le mode Plan réduit la consommation de tokens de 60 à 75 % par rapport au mode normal pour les phases d'exploration. La fiche complète sur la gestion du contexte détaille les cas d'usage avancés du mode Plan.
Pour aller plus loin sur l'optimisation de vos workflows, SFEIR Institute propose une formation Claude Code d'une journée. Vous y pratiquerez la gestion du contexte, le mode Plan et les stratégies d'optimisation dans des labs encadrés.
À retenir : le mode Plan (Shift+Tab) divise votre consommation par 3 pendant les phases d'exploration - utilisez-le systématiquement avant de coder.
Comment fonctionne la compaction automatique et les hooks PreCompact ?
La compaction automatique se déclenche lorsque la conversation atteint environ 80 % de la fenêtre de contexte (≈160 000 tokens). Claude Code résume alors l'historique pour libérer de l'espace.
Le processus de compaction
- Claude Code détecte que le seuil de 80 % est atteint
- Il génère un résumé structuré de la conversation
- L'historique complet est remplacé par ce résumé
- La conversation continue avec le résumé comme base
En pratique, la compaction réduit l'historique de 120 000 tokens à environ 8 000–12 000 tokens, soit une réduction de 90 %.
Configurer un hook PreCompact
Les hooks PreCompact vous permettent d'exécuter du code avant chaque compaction. Configurez-les dans votre fichier .claude/settings.json :
{
"hooks": {
"PreCompact": [
{
"command": "echo '=== CONTEXTE CRITIQUE ===' && cat .claude/context-notes.md",
"timeout": 5000
}
]
}
}
Ce hook injecte vos notes de contexte critiques dans le résumé de compaction. Concrètement, cela garantit que certaines informations survivent à chaque cycle de compaction.
Commandes de compaction
| Commande | Comportement | Contexte préservé |
|---|---|---|
/compact | Compaction manuelle immédiate | Résumé global |
/compact focus auth | Compaction ciblée sur un thème | Résumé focalisé sur l'auth |
| Compaction auto (80 %) | Déclenchement automatique | Résumé global |
| PreCompact hook | Code exécuté avant compaction | Données du hook ajoutées |
Pour configurer des hooks avancés, consultez l'aide-mémoire d'intégration Git qui montre des exemples de hooks dans différents contextes. Vous pouvez aussi consulter la FAQ sur la gestion du contexte pour les questions fréquentes sur la compaction.
À retenir : la compaction automatique est votre filet de sécurité - les hooks PreCompact sont votre moyen de contrôler ce qui survit au résumé.
Comment scaler avec les multi-sessions et le parallélisme horizontal ?
Quand un seul contexte de 200k tokens ne suffit pas, répartissez le travail sur plusieurs sessions Claude Code en parallèle. C'est le scaling horizontal du développement assisté par IA.
Lancer des sessions parallèles
# Terminal 1 : session backend
claude --session backend-api
# Terminal 2 : session frontend
claude --session frontend-ui
# Terminal 3 : session tests
claude --session test-suite
Chaque session dispose de sa propre fenêtre de 200k tokens. Trois sessions parallèles offrent 600 000 tokens de contexte total.
Orchestrer avec le mode headless
Pour les tâches automatisées, utilisez le mode headless qui exécute Claude Code sans interface interactive :
# Lancer un audit en arrière-plan
claude -p "Audite tous les fichiers src/**/*.ts pour les vulnérabilités XSS" --output-format json > audit.json
# Lancer plusieurs tâches en parallèle
claude -p "Corrige les types dans src/models/" &
claude -p "Ajoute les tests manquants dans tests/" &
wait
Pour exploiter le mode headless en CI/CD, l'aide-mémoire du mode headless et CI/CD fournit des pipelines prêts à l'emploi.
| Approche | Tokens disponibles | Cas d'usage |
|---|---|---|
| Session unique | 200 000 | Tâche ciblée, fichier unique |
| 2 sessions parallèles | 400 000 | Frontend + backend séparés |
| 3+ sessions parallèles | 600 000+ | Projet multi-composants |
| Mode headless pipeline | Illimité (séquentiel) | CI/CD, audits automatisés |
le mode multi-sessions améliore la productivité de 40 % sur les projets impliquant plus de 5 fichiers simultanément. En pratique, 85 % des développeurs qui adoptent le multi-sessions réduisent leur temps de refactorisation de 30 à 50 %.
À retenir : ouvrez une session par domaine fonctionnel - chaque session bénéficie de 100 % de la fenêtre de contexte sans interférence.
Quels raccourcis clavier accélèrent la gestion du contexte ?
Voici la référence complète des raccourcis liés à la gestion du contexte dans Claude Code.
| Raccourci | Action | Impact sur le contexte |
|---|---|---|
Shift+Tab | Bascule mode Plan/Normal | Réduit la consommation de 60-75 % |
Esc (1×) | Interrompt la génération en cours | Stoppe la consommation immédiatement |
Esc (2×) | Annule le tour complet | Économise les tokens de la réponse |
Ctrl+C | Quitte Claude Code | Libère toutes les ressources |
↑ (flèche haut) | Rappelle le dernier message | Évite de retaper (0 token supplémentaire) |
Tab | Accepte la complétion proposée | N'ajoute pas de tokens de prompt |
Pour maîtriser l'ensemble des commandes et raccourcis, l'aide-mémoire d'installation et premier lancement couvre la configuration initiale des raccourcis.
Si vous souhaitez aller au-delà de cet aide-mémoire, SFEIR Institute propose la formation Développeur Augmenté par l'IA sur 2 jours. Vous y apprendrez à orchestrer plusieurs agents, à optimiser vos pipelines de contexte et à intégrer Claude Code dans vos workflows d'équipe. Pour les profils confirmés, la formation Développeur Augmenté par l'IA – Avancé d'une journée approfondit le scaling multi-sessions et les hooks personnalisés.
À retenir : Shift+Tab et Esc (double-tap) sont les deux raccourcis qui impactent le plus votre budget de contexte.
Quelles erreurs courantes gaspillent le contexte ?
Évitez ces pièges fréquents qui consomment inutilement des tokens.
| Erreur | Coût en tokens | Solution |
|---|---|---|
| Charger un fichier entier de 2 000 lignes | ~16 000 tokens | Ciblez avec offset/limit |
| Répéter la même question reformulée | ~600 tokens/message | Compactez avant de reformuler |
Ne jamais utiliser /compact | Saturation en 10 échanges | Compactez toutes les 8-10 interactions |
| Ignorer le mode Plan pour explorer | 3× plus de tokens | Basculez en mode Plan avec Shift+Tab |
| Tout faire dans une seule session | Contexte pollué à 100 % | Séparez en sessions thématiques |
| Coller des logs complets dans le prompt | 5 000–50 000 tokens | Filtrez les logs avant de les coller |
En pratique, 70 % des dépassements de contexte proviennent de fichiers chargés sans filtrage. Un fichier package-lock.json peut à lui seul consommer 80 000 tokens.
Pour identifier et corriger ces erreurs dans votre usage quotidien, consultez le guide des erreurs courantes de gestion du contexte. Vous pouvez aussi explorer les possibilités du protocole MCP pour externaliser certaines données hors du contexte principal.
À retenir : un seul fichier mal ciblé peut consommer 40 % de votre fenêtre - vérifiez toujours la taille avant de charger.
Comment mettre en place un workflow quotidien de gestion du contexte ?
Voici un workflow type pour une journée de développement avec Claude Code, optimisé pour la gestion du contexte.
Séquence de démarrage
- Lancez Claude Code dans le répertoire du projet :
claude - Vérifiez que le fichier CLAUDE.md est à jour :
/init - Activez le mode Plan pour explorer :
Shift+Tab - Formulez votre objectif en une phrase ciblée
Séquence de travail
- Explorez en mode Plan (lecture seule, économie de tokens)
- Basculez en mode Normal pour implémenter :
Shift+Tab - Compactez toutes les 8 à 10 interactions :
/compact - Séparez les tâches longues en sessions dédiées
Séquence de fin de journée
- Compactez une dernière fois avec instructions :
/compact résumé des changements du jour - Notez l'ID de session pour reprise : visible dans le prompt
- Reprenez le lendemain :
claude --resume
# Workflow complet en commandes
claude # 1. Démarrer
/init # 2. Initialiser CLAUDE.md
# Shift+Tab # 3. Mode Plan
# ... explorer et planifier ...
# Shift+Tab # 4. Mode Normal
# ... implémenter ...
/compact garde les modifs auth # 5. Compacter
# ... continuer ...
/compact résumé final # 6. Fin de journée
Concrètement, ce workflow permet de maintenir un contexte optimal sur une journée complète de 8 heures avec 40 à 60 interactions. Pour approfondir chaque étape, la fiche de référence rapide sur la gestion du contexte centralise toutes les ressources.
À retenir : démarrez en mode Plan, compactez régulièrement, séparez les domaines en sessions - ces trois principes couvrent 90 % des besoins.
Contenu rédigé par SFEIR Institute - organisme de formation IT spécialisé dans les technologies cloud et IA. Retrouvez nos formations sur sfeir.com.
Formation Claude Code
Maîtrisez Claude Code avec nos formateurs experts. Formation pratique, hands-on, directement applicable à vos projets.
Voir le programme