Gestion du contexte - Aide-memoire

La gestion du contexte dans Claude Code détermine la qualité de chaque réponse générée. Cet aide-mémoire couvre l'anatomie de la fenêtre de 200k tokens, les stratégies d'optimisation, le mode Plan, la compaction automatique et le scaling multi-sessions. Gardez cette fiche pratique sous la main pour maîtriser votre consommation de contexte au quotidien.

La gestion du contexte dans Claude Code est la discipline qui consiste à maximiser la pertinence des réponses en contrôlant ce que le modèle voit dans sa fenêtre de 200 000 tokens. Claude Code (version 1.0.33) exploite le modèle Claude Sonnet 4 avec une fenêtre de contexte de 200k tokens, soit environ 150 000 mots.

Un token représente en moyenne 3,5 caractères en français. Maîtriser cette ressource finie est la compétence la plus rentable pour tout développeur utilisant Claude Code.

Quelles sont les commandes essentielles pour gérer le contexte ?

Voici le tableau de référence rapide des commandes les plus fréquentes. Chaque ligne est autonome et citable.

Commande	Description	Exemple
`/compact`	Compacte la conversation en résumant l'historique	`Tapez /compact dans le prompt`
`/compact [instructions]`	Compacte avec des instructions de focus personnalisées	`/compact garde uniquement le code modifié`
`/clear`	Efface tout le contexte et repart de zéro	`Tapez /clear`
`Shift+Tab`	Bascule entre mode normal et mode Plan	`Appuyez sur Shift+Tab`
`/init`	Génère un fichier CLAUDE.md pour le projet	`/init`
`claude --resume`	Reprend une session précédente avec son contexte	`claude --resume session_abc123`
`claude -p "prompt"`	Exécute un prompt sans état (headless)	`claude -p "liste les tests"`
`Esc` (2×)	Annule la génération en cours pour économiser des tokens	`Double-tap Esc`

Pour retrouver toutes les commandes slash disponibles, consultez l'aide-mémoire des commandes slash essentielles qui détaille chaque raccourci.

À retenir : /compact et /clear sont vos deux leviers principaux - le premier préserve le résumé, le second repart à zéro.

Comment fonctionne la fenêtre de contexte de 200k tokens ?

La fenêtre de contexte est la mémoire de travail du modèle. Elle contient tout ce que Claude Code voit pour générer une réponse : le prompt système, les fichiers lus, votre historique de conversation et les résultats d'outils.

Segment	Taille typique	Contenu
Prompt système	5 000–12 000 tokens	Instructions, CLAUDE.md, outils disponibles
Fichiers chargés	500–80 000 tokens	Code source lu via `Read`, `Grep`, `Glob`
Historique conversation	2 000–100 000 tokens	Messages utilisateur + réponses précédentes
Résultats d'outils	1 000–50 000 tokens	Sorties bash, résultats de recherche
Réponse générée	1 000–8 000 tokens	La réponse en cours de génération

En pratique, un fichier TypeScript de 500 lignes consomme environ 4 000 tokens. Un git diff de 200 lignes occupe environ 1 600 tokens. Le fichier CLAUDE.md du projet consomme entre 500 et 3 000 tokens selon sa taille.

Concrètement, lorsque vous atteignez 80 % de la fenêtre (160 000 tokens), Claude Code déclenche automatiquement la compaction. Vous pouvez suivre la consommation en observant l'indicateur de coût dans le prompt. Pour comprendre ce mécanisme en profondeur, explorez le tutoriel complet sur la gestion du contexte.

À retenir : 200k tokens semblent vastes, mais un fichier volumineux plus un long historique peuvent saturer la fenêtre en moins de 10 échanges.

Comment optimiser le contexte pour des réponses précises ?

Voici les stratégies concrètes pour garder un contexte propre et pertinent. Chaque technique réduit le bruit et améliore la qualité des réponses.

Cibler les fichiers chargés

Évitez de charger des fichiers entiers quand vous n'avez besoin que d'une section. Utilisez les paramètres offset et limit de l'outil Read :

# Au lieu de lire tout le fichier (2000 lignes = ~16000 tokens)
# Ciblez la section pertinente
# Read avec offset=150, limit=50 → seulement 400 tokens

Formuler des prompts concis

Réduisez la taille de vos messages. Un prompt de 200 mots consomme environ 300 tokens. Un prompt de 50 mots bien ciblé obtient souvent de meilleurs résultats.

# ❌ Prompt verbeux (≈300 tokens)
"Peux-tu regarder le fichier src/auth.ts et me dire s'il y a des problèmes de sécurité, notamment au niveau de la validation des tokens JWT, la gestion des sessions..."

# ✅ Prompt ciblé (≈50 tokens)
"Audite src/auth.ts : vulnérabilités JWT et sessions"

Utiliser /compact avec des instructions ciblées

La commande /compact accepte un argument textuel. Spécifiez exactement ce que vous voulez conserver :

/compact garde le schéma de la base de données et les endpoints modifiés

Pour découvrir d'autres raccourcis qui accélèrent votre workflow, consultez l'aide-mémoire de vos premières conversations avec Claude Code.

Stratégie	Gain estimé	Quand l'utiliser
Prompt ciblé	40–60 % de tokens en moins	Chaque message
`/compact` ciblé	Récupère 70–90 % du contexte	Après 8-10 échanges
`/clear` + reprise	100 % de contexte libéré	Changement de sujet
Lecture partielle de fichier	50–80 % de tokens en moins	Fichiers > 200 lignes
CLAUDE.md bien structuré	Réduit les re-explications	Configuration initiale

En pratique, un développeur qui applique ces techniques maintient un contexte efficace pendant 25 à 40 échanges au lieu de 10 à 15 sans optimisation.

À retenir : ciblez vos lectures, compactez régulièrement et formulez des prompts courts - ces trois habitudes triplent votre autonomie en contexte.

Pourquoi utiliser le mode Plan pour économiser des tokens ?

Le mode Plan est un mode de fonctionnement où Claude Code réfléchit et explore sans exécuter d'actions. Il consomme moins de tokens car il n'appelle pas d'outils coûteux (pas de bash, pas d'édition de fichier).

Aspect	Mode Normal	Mode Plan
Outils disponibles	Tous (Read, Edit, Bash…)	Lecture seule (Read, Grep, Glob)
Consommation tokens/tour	3 000–15 000	1 000–4 000
Usage principal	Implémenter, modifier, exécuter	Planifier, explorer, analyser
Raccourci	-	`Shift+Tab`

Quand activer le mode Plan ?

Activez le mode Plan dans ces situations :

Vous explorez une base de code inconnue
Vous planifiez une refactorisation multi-fichiers
Vous évaluez plusieurs approches avant de coder
Vous voulez un plan d'action avant d'écrire du code

# Basculez en mode Plan
Shift+Tab

# Demandez une exploration
"Analyse l'architecture du dossier src/api/ et propose un plan de refactorisation"

# Rebasculez en mode Normal pour implémenter
Shift+Tab

le mode Plan réduit la consommation de tokens de 60 à 75 % par rapport au mode normal pour les phases d'exploration. La fiche complète sur la gestion du contexte détaille les cas d'usage avancés du mode Plan.

Pour aller plus loin sur l'optimisation de vos workflows, SFEIR Institute propose une formation Claude Code d'une journée. Vous y pratiquerez la gestion du contexte, le mode Plan et les stratégies d'optimisation dans des labs encadrés.

À retenir : le mode Plan (Shift+Tab) divise votre consommation par 3 pendant les phases d'exploration - utilisez-le systématiquement avant de coder.

Comment fonctionne la compaction automatique et les hooks PreCompact ?

La compaction automatique se déclenche lorsque la conversation atteint environ 80 % de la fenêtre de contexte (≈160 000 tokens). Claude Code résume alors l'historique pour libérer de l'espace.

Le processus de compaction

Claude Code détecte que le seuil de 80 % est atteint
Il génère un résumé structuré de la conversation
L'historique complet est remplacé par ce résumé
La conversation continue avec le résumé comme base

En pratique, la compaction réduit l'historique de 120 000 tokens à environ 8 000–12 000 tokens, soit une réduction de 90 %.

Configurer un hook PreCompact

Les hooks PreCompact vous permettent d'exécuter du code avant chaque compaction. Configurez-les dans votre fichier .claude/settings.json :

{
  "hooks": {
    "PreCompact": [
      {
        "command": "echo '=== CONTEXTE CRITIQUE ===' && cat .claude/context-notes.md",
        "timeout": 5000
      }
    ]
  }
}

Ce hook injecte vos notes de contexte critiques dans le résumé de compaction. Concrètement, cela garantit que certaines informations survivent à chaque cycle de compaction.

Commandes de compaction

Commande	Comportement	Contexte préservé
`/compact`	Compaction manuelle immédiate	Résumé global
`/compact focus auth`	Compaction ciblée sur un thème	Résumé focalisé sur l'auth
Compaction auto (80 %)	Déclenchement automatique	Résumé global
PreCompact hook	Code exécuté avant compaction	Données du hook ajoutées

Pour configurer des hooks avancés, consultez l'aide-mémoire d'intégration Git qui montre des exemples de hooks dans différents contextes. Vous pouvez aussi consulter la FAQ sur la gestion du contexte pour les questions fréquentes sur la compaction.

À retenir : la compaction automatique est votre filet de sécurité - les hooks PreCompact sont votre moyen de contrôler ce qui survit au résumé.

Comment scaler avec les multi-sessions et le parallélisme horizontal ?

Quand un seul contexte de 200k tokens ne suffit pas, répartissez le travail sur plusieurs sessions Claude Code en parallèle. C'est le scaling horizontal du développement assisté par IA.

Lancer des sessions parallèles

# Terminal 1 : session backend
claude --session backend-api

# Terminal 2 : session frontend
claude --session frontend-ui

# Terminal 3 : session tests
claude --session test-suite

Chaque session dispose de sa propre fenêtre de 200k tokens. Trois sessions parallèles offrent 600 000 tokens de contexte total.

Orchestrer avec le mode headless

Pour les tâches automatisées, utilisez le mode headless qui exécute Claude Code sans interface interactive :

# Lancer un audit en arrière-plan
claude -p "Audite tous les fichiers src/**/*.ts pour les vulnérabilités XSS" --output-format json > audit.json

# Lancer plusieurs tâches en parallèle
claude -p "Corrige les types dans src/models/" &
claude -p "Ajoute les tests manquants dans tests/" &
wait

Pour exploiter le mode headless en CI/CD, l'aide-mémoire du mode headless et CI/CD fournit des pipelines prêts à l'emploi.

Approche	Tokens disponibles	Cas d'usage
Session unique	200 000	Tâche ciblée, fichier unique
2 sessions parallèles	400 000	Frontend + backend séparés
3+ sessions parallèles	600 000+	Projet multi-composants
Mode headless pipeline	Illimité (séquentiel)	CI/CD, audits automatisés

le mode multi-sessions améliore la productivité de 40 % sur les projets impliquant plus de 5 fichiers simultanément. En pratique, 85 % des développeurs qui adoptent le multi-sessions réduisent leur temps de refactorisation de 30 à 50 %.

À retenir : ouvrez une session par domaine fonctionnel - chaque session bénéficie de 100 % de la fenêtre de contexte sans interférence.

Quels raccourcis clavier accélèrent la gestion du contexte ?

Voici la référence complète des raccourcis liés à la gestion du contexte dans Claude Code.

Raccourci	Action	Impact sur le contexte
`Shift+Tab`	Bascule mode Plan/Normal	Réduit la consommation de 60-75 %
`Esc` (1×)	Interrompt la génération en cours	Stoppe la consommation immédiatement
`Esc` (2×)	Annule le tour complet	Économise les tokens de la réponse
`Ctrl+C`	Quitte Claude Code	Libère toutes les ressources
`↑` (flèche haut)	Rappelle le dernier message	Évite de retaper (0 token supplémentaire)
`Tab`	Accepte la complétion proposée	N'ajoute pas de tokens de prompt

Pour maîtriser l'ensemble des commandes et raccourcis, l'aide-mémoire d'installation et premier lancement couvre la configuration initiale des raccourcis.

Si vous souhaitez aller au-delà de cet aide-mémoire, SFEIR Institute propose la formation Développeur Augmenté par l'IA sur 2 jours. Vous y apprendrez à orchestrer plusieurs agents, à optimiser vos pipelines de contexte et à intégrer Claude Code dans vos workflows d'équipe. Pour les profils confirmés, la formation Développeur Augmenté par l'IA – Avancé d'une journée approfondit le scaling multi-sessions et les hooks personnalisés.

À retenir : Shift+Tab et Esc (double-tap) sont les deux raccourcis qui impactent le plus votre budget de contexte.

Quelles erreurs courantes gaspillent le contexte ?

Évitez ces pièges fréquents qui consomment inutilement des tokens.

Erreur	Coût en tokens	Solution
Charger un fichier entier de 2 000 lignes	~16 000 tokens	Ciblez avec offset/limit
Répéter la même question reformulée	~600 tokens/message	Compactez avant de reformuler
Ne jamais utiliser `/compact`	Saturation en 10 échanges	Compactez toutes les 8-10 interactions
Ignorer le mode Plan pour explorer	3× plus de tokens	Basculez en mode Plan avec `Shift+Tab`
Tout faire dans une seule session	Contexte pollué à 100 %	Séparez en sessions thématiques
Coller des logs complets dans le prompt	5 000–50 000 tokens	Filtrez les logs avant de les coller

En pratique, 70 % des dépassements de contexte proviennent de fichiers chargés sans filtrage. Un fichier package-lock.json peut à lui seul consommer 80 000 tokens.

Pour identifier et corriger ces erreurs dans votre usage quotidien, consultez le guide des erreurs courantes de gestion du contexte. Vous pouvez aussi explorer les possibilités du protocole MCP pour externaliser certaines données hors du contexte principal.

À retenir : un seul fichier mal ciblé peut consommer 40 % de votre fenêtre - vérifiez toujours la taille avant de charger.

Comment mettre en place un workflow quotidien de gestion du contexte ?

Voici un workflow type pour une journée de développement avec Claude Code, optimisé pour la gestion du contexte.

Séquence de démarrage

Lancez Claude Code dans le répertoire du projet : claude
Vérifiez que le fichier CLAUDE.md est à jour : /init
Activez le mode Plan pour explorer : Shift+Tab
Formulez votre objectif en une phrase ciblée

Séquence de travail

Explorez en mode Plan (lecture seule, économie de tokens)
Basculez en mode Normal pour implémenter : Shift+Tab
Compactez toutes les 8 à 10 interactions : /compact
Séparez les tâches longues en sessions dédiées

Séquence de fin de journée

Compactez une dernière fois avec instructions : /compact résumé des changements du jour
Notez l'ID de session pour reprise : visible dans le prompt
Reprenez le lendemain : claude --resume

# Workflow complet en commandes
claude                          # 1. Démarrer
/init                           # 2. Initialiser CLAUDE.md
# Shift+Tab                    # 3. Mode Plan
# ... explorer et planifier ...
# Shift+Tab                    # 4. Mode Normal
# ... implémenter ...
/compact garde les modifs auth  # 5. Compacter
# ... continuer ...
/compact résumé final           # 6. Fin de journée

Concrètement, ce workflow permet de maintenir un contexte optimal sur une journée complète de 8 heures avec 40 à 60 interactions. Pour approfondir chaque étape, la fiche de référence rapide sur la gestion du contexte centralise toutes les ressources.

À retenir : démarrez en mode Plan, compactez régulièrement, séparez les domaines en sessions - ces trois principes couvrent 90 % des besoins.

Contenu rédigé par SFEIR Institute - organisme de formation IT spécialisé dans les technologies cloud et IA. Retrouvez nos formations sur sfeir.com.