Aide-mémoire11 min de lecture

Gestion du contexte - Aide-memoire

SFEIR Institute

En Bref (TL;DR)

La gestion du contexte dans Claude Code détermine la qualité de chaque réponse générée. Cet aide-mémoire couvre l'anatomie de la fenêtre de 200k tokens, les stratégies d'optimisation, le mode Plan, la compaction automatique et le scaling multi-sessions. Gardez cette fiche pratique sous la main pour maîtriser votre consommation de contexte au quotidien.

La gestion du contexte dans Claude Code détermine la qualité de chaque réponse générée. Cet aide-mémoire couvre l'anatomie de la fenêtre de 200k tokens, les stratégies d'optimisation, le mode Plan, la compaction automatique et le scaling multi-sessions. Gardez cette fiche pratique sous la main pour maîtriser votre consommation de contexte au quotidien.

La gestion du contexte dans Claude Code est la discipline qui consiste à maximiser la pertinence des réponses en contrôlant ce que le modèle voit dans sa fenêtre de 200 000 tokens. Claude Code (version 1.0.33) exploite le modèle Claude Sonnet 4 avec une fenêtre de contexte de 200k tokens, soit environ 150 000 mots.

Un token représente en moyenne 3,5 caractères en français. Maîtriser cette ressource finie est la compétence la plus rentable pour tout développeur utilisant Claude Code.

Quelles sont les commandes essentielles pour gérer le contexte ?

Voici le tableau de référence rapide des commandes les plus fréquentes. Chaque ligne est autonome et citable.

CommandeDescriptionExemple
/compactCompacte la conversation en résumant l'historiqueTapez /compact dans le prompt
/compact [instructions]Compacte avec des instructions de focus personnalisées/compact garde uniquement le code modifié
/clearEfface tout le contexte et repart de zéroTapez /clear
Shift+TabBascule entre mode normal et mode PlanAppuyez sur Shift+Tab
/initGénère un fichier CLAUDE.md pour le projet/init
claude --resumeReprend une session précédente avec son contexteclaude --resume session_abc123
claude -p "prompt"Exécute un prompt sans état (headless)claude -p "liste les tests"
Esc (2×)Annule la génération en cours pour économiser des tokensDouble-tap Esc

Pour retrouver toutes les commandes slash disponibles, consultez l'aide-mémoire des commandes slash essentielles qui détaille chaque raccourci.

À retenir : /compact et /clear sont vos deux leviers principaux - le premier préserve le résumé, le second repart à zéro.

Comment fonctionne la fenêtre de contexte de 200k tokens ?

La fenêtre de contexte est la mémoire de travail du modèle. Elle contient tout ce que Claude Code voit pour générer une réponse : le prompt système, les fichiers lus, votre historique de conversation et les résultats d'outils.

SegmentTaille typiqueContenu
Prompt système5 000–12 000 tokensInstructions, CLAUDE.md, outils disponibles
Fichiers chargés500–80 000 tokensCode source lu via Read, Grep, Glob
Historique conversation2 000–100 000 tokensMessages utilisateur + réponses précédentes
Résultats d'outils1 000–50 000 tokensSorties bash, résultats de recherche
Réponse générée1 000–8 000 tokensLa réponse en cours de génération

En pratique, un fichier TypeScript de 500 lignes consomme environ 4 000 tokens. Un git diff de 200 lignes occupe environ 1 600 tokens. Le fichier CLAUDE.md du projet consomme entre 500 et 3 000 tokens selon sa taille.

Concrètement, lorsque vous atteignez 80 % de la fenêtre (160 000 tokens), Claude Code déclenche automatiquement la compaction. Vous pouvez suivre la consommation en observant l'indicateur de coût dans le prompt. Pour comprendre ce mécanisme en profondeur, explorez le tutoriel complet sur la gestion du contexte.

À retenir : 200k tokens semblent vastes, mais un fichier volumineux plus un long historique peuvent saturer la fenêtre en moins de 10 échanges.

Comment optimiser le contexte pour des réponses précises ?

Voici les stratégies concrètes pour garder un contexte propre et pertinent. Chaque technique réduit le bruit et améliore la qualité des réponses.

Cibler les fichiers chargés

Évitez de charger des fichiers entiers quand vous n'avez besoin que d'une section. Utilisez les paramètres offset et limit de l'outil Read :

# Au lieu de lire tout le fichier (2000 lignes = ~16000 tokens)
# Ciblez la section pertinente
# Read avec offset=150, limit=50 → seulement 400 tokens

Formuler des prompts concis

Réduisez la taille de vos messages. Un prompt de 200 mots consomme environ 300 tokens. Un prompt de 50 mots bien ciblé obtient souvent de meilleurs résultats.

# ❌ Prompt verbeux (≈300 tokens)
"Peux-tu regarder le fichier src/auth.ts et me dire s'il y a des problèmes de sécurité, notamment au niveau de la validation des tokens JWT, la gestion des sessions..."

# ✅ Prompt ciblé (≈50 tokens)
"Audite src/auth.ts : vulnérabilités JWT et sessions"

Utiliser /compact avec des instructions ciblées

La commande /compact accepte un argument textuel. Spécifiez exactement ce que vous voulez conserver :

/compact garde le schéma de la base de données et les endpoints modifiés

Pour découvrir d'autres raccourcis qui accélèrent votre workflow, consultez l'aide-mémoire de vos premières conversations avec Claude Code.

StratégieGain estiméQuand l'utiliser
Prompt ciblé40–60 % de tokens en moinsChaque message
/compact cibléRécupère 70–90 % du contexteAprès 8-10 échanges
/clear + reprise100 % de contexte libéréChangement de sujet
Lecture partielle de fichier50–80 % de tokens en moinsFichiers > 200 lignes
CLAUDE.md bien structuréRéduit les re-explicationsConfiguration initiale

En pratique, un développeur qui applique ces techniques maintient un contexte efficace pendant 25 à 40 échanges au lieu de 10 à 15 sans optimisation.

À retenir : ciblez vos lectures, compactez régulièrement et formulez des prompts courts - ces trois habitudes triplent votre autonomie en contexte.

Pourquoi utiliser le mode Plan pour économiser des tokens ?

Le mode Plan est un mode de fonctionnement où Claude Code réfléchit et explore sans exécuter d'actions. Il consomme moins de tokens car il n'appelle pas d'outils coûteux (pas de bash, pas d'édition de fichier).

AspectMode NormalMode Plan
Outils disponiblesTous (Read, Edit, Bash…)Lecture seule (Read, Grep, Glob)
Consommation tokens/tour3 000–15 0001 000–4 000
Usage principalImplémenter, modifier, exécuterPlanifier, explorer, analyser
Raccourci-Shift+Tab

Quand activer le mode Plan ?

Activez le mode Plan dans ces situations :

  1. Vous explorez une base de code inconnue
  2. Vous planifiez une refactorisation multi-fichiers
  3. Vous évaluez plusieurs approches avant de coder
  4. Vous voulez un plan d'action avant d'écrire du code
# Basculez en mode Plan
Shift+Tab

# Demandez une exploration
"Analyse l'architecture du dossier src/api/ et propose un plan de refactorisation"

# Rebasculez en mode Normal pour implémenter
Shift+Tab

le mode Plan réduit la consommation de tokens de 60 à 75 % par rapport au mode normal pour les phases d'exploration. La fiche complète sur la gestion du contexte détaille les cas d'usage avancés du mode Plan.

Pour aller plus loin sur l'optimisation de vos workflows, SFEIR Institute propose une formation Claude Code d'une journée. Vous y pratiquerez la gestion du contexte, le mode Plan et les stratégies d'optimisation dans des labs encadrés.

À retenir : le mode Plan (Shift+Tab) divise votre consommation par 3 pendant les phases d'exploration - utilisez-le systématiquement avant de coder.

Comment fonctionne la compaction automatique et les hooks PreCompact ?

La compaction automatique se déclenche lorsque la conversation atteint environ 80 % de la fenêtre de contexte (≈160 000 tokens). Claude Code résume alors l'historique pour libérer de l'espace.

Le processus de compaction

  1. Claude Code détecte que le seuil de 80 % est atteint
  2. Il génère un résumé structuré de la conversation
  3. L'historique complet est remplacé par ce résumé
  4. La conversation continue avec le résumé comme base

En pratique, la compaction réduit l'historique de 120 000 tokens à environ 8 000–12 000 tokens, soit une réduction de 90 %.

Configurer un hook PreCompact

Les hooks PreCompact vous permettent d'exécuter du code avant chaque compaction. Configurez-les dans votre fichier .claude/settings.json :

{
  "hooks": {
    "PreCompact": [
      {
        "command": "echo '=== CONTEXTE CRITIQUE ===' && cat .claude/context-notes.md",
        "timeout": 5000
      }
    ]
  }
}

Ce hook injecte vos notes de contexte critiques dans le résumé de compaction. Concrètement, cela garantit que certaines informations survivent à chaque cycle de compaction.

Commandes de compaction

CommandeComportementContexte préservé
/compactCompaction manuelle immédiateRésumé global
/compact focus authCompaction ciblée sur un thèmeRésumé focalisé sur l'auth
Compaction auto (80 %)Déclenchement automatiqueRésumé global
PreCompact hookCode exécuté avant compactionDonnées du hook ajoutées

Pour configurer des hooks avancés, consultez l'aide-mémoire d'intégration Git qui montre des exemples de hooks dans différents contextes. Vous pouvez aussi consulter la FAQ sur la gestion du contexte pour les questions fréquentes sur la compaction.

À retenir : la compaction automatique est votre filet de sécurité - les hooks PreCompact sont votre moyen de contrôler ce qui survit au résumé.

Comment scaler avec les multi-sessions et le parallélisme horizontal ?

Quand un seul contexte de 200k tokens ne suffit pas, répartissez le travail sur plusieurs sessions Claude Code en parallèle. C'est le scaling horizontal du développement assisté par IA.

Lancer des sessions parallèles

# Terminal 1 : session backend
claude --session backend-api

# Terminal 2 : session frontend
claude --session frontend-ui

# Terminal 3 : session tests
claude --session test-suite

Chaque session dispose de sa propre fenêtre de 200k tokens. Trois sessions parallèles offrent 600 000 tokens de contexte total.

Orchestrer avec le mode headless

Pour les tâches automatisées, utilisez le mode headless qui exécute Claude Code sans interface interactive :

# Lancer un audit en arrière-plan
claude -p "Audite tous les fichiers src/**/*.ts pour les vulnérabilités XSS" --output-format json > audit.json

# Lancer plusieurs tâches en parallèle
claude -p "Corrige les types dans src/models/" &
claude -p "Ajoute les tests manquants dans tests/" &
wait

Pour exploiter le mode headless en CI/CD, l'aide-mémoire du mode headless et CI/CD fournit des pipelines prêts à l'emploi.

ApprocheTokens disponiblesCas d'usage
Session unique200 000Tâche ciblée, fichier unique
2 sessions parallèles400 000Frontend + backend séparés
3+ sessions parallèles600 000+Projet multi-composants
Mode headless pipelineIllimité (séquentiel)CI/CD, audits automatisés

le mode multi-sessions améliore la productivité de 40 % sur les projets impliquant plus de 5 fichiers simultanément. En pratique, 85 % des développeurs qui adoptent le multi-sessions réduisent leur temps de refactorisation de 30 à 50 %.

À retenir : ouvrez une session par domaine fonctionnel - chaque session bénéficie de 100 % de la fenêtre de contexte sans interférence.

Quels raccourcis clavier accélèrent la gestion du contexte ?

Voici la référence complète des raccourcis liés à la gestion du contexte dans Claude Code.

RaccourciActionImpact sur le contexte
Shift+TabBascule mode Plan/NormalRéduit la consommation de 60-75 %
Esc (1×)Interrompt la génération en coursStoppe la consommation immédiatement
Esc (2×)Annule le tour completÉconomise les tokens de la réponse
Ctrl+CQuitte Claude CodeLibère toutes les ressources
(flèche haut)Rappelle le dernier messageÉvite de retaper (0 token supplémentaire)
TabAccepte la complétion proposéeN'ajoute pas de tokens de prompt

Pour maîtriser l'ensemble des commandes et raccourcis, l'aide-mémoire d'installation et premier lancement couvre la configuration initiale des raccourcis.

Si vous souhaitez aller au-delà de cet aide-mémoire, SFEIR Institute propose la formation Développeur Augmenté par l'IA sur 2 jours. Vous y apprendrez à orchestrer plusieurs agents, à optimiser vos pipelines de contexte et à intégrer Claude Code dans vos workflows d'équipe. Pour les profils confirmés, la formation Développeur Augmenté par l'IA – Avancé d'une journée approfondit le scaling multi-sessions et les hooks personnalisés.

À retenir : Shift+Tab et Esc (double-tap) sont les deux raccourcis qui impactent le plus votre budget de contexte.

Quelles erreurs courantes gaspillent le contexte ?

Évitez ces pièges fréquents qui consomment inutilement des tokens.

ErreurCoût en tokensSolution
Charger un fichier entier de 2 000 lignes~16 000 tokensCiblez avec offset/limit
Répéter la même question reformulée~600 tokens/messageCompactez avant de reformuler
Ne jamais utiliser /compactSaturation en 10 échangesCompactez toutes les 8-10 interactions
Ignorer le mode Plan pour explorer3× plus de tokensBasculez en mode Plan avec Shift+Tab
Tout faire dans une seule sessionContexte pollué à 100 %Séparez en sessions thématiques
Coller des logs complets dans le prompt5 000–50 000 tokensFiltrez les logs avant de les coller

En pratique, 70 % des dépassements de contexte proviennent de fichiers chargés sans filtrage. Un fichier package-lock.json peut à lui seul consommer 80 000 tokens.

Pour identifier et corriger ces erreurs dans votre usage quotidien, consultez le guide des erreurs courantes de gestion du contexte. Vous pouvez aussi explorer les possibilités du protocole MCP pour externaliser certaines données hors du contexte principal.

À retenir : un seul fichier mal ciblé peut consommer 40 % de votre fenêtre - vérifiez toujours la taille avant de charger.

Comment mettre en place un workflow quotidien de gestion du contexte ?

Voici un workflow type pour une journée de développement avec Claude Code, optimisé pour la gestion du contexte.

Séquence de démarrage

  1. Lancez Claude Code dans le répertoire du projet : claude
  2. Vérifiez que le fichier CLAUDE.md est à jour : /init
  3. Activez le mode Plan pour explorer : Shift+Tab
  4. Formulez votre objectif en une phrase ciblée

Séquence de travail

  1. Explorez en mode Plan (lecture seule, économie de tokens)
  2. Basculez en mode Normal pour implémenter : Shift+Tab
  3. Compactez toutes les 8 à 10 interactions : /compact
  4. Séparez les tâches longues en sessions dédiées

Séquence de fin de journée

  1. Compactez une dernière fois avec instructions : /compact résumé des changements du jour
  2. Notez l'ID de session pour reprise : visible dans le prompt
  3. Reprenez le lendemain : claude --resume
# Workflow complet en commandes
claude                          # 1. Démarrer
/init                           # 2. Initialiser CLAUDE.md
# Shift+Tab                    # 3. Mode Plan
# ... explorer et planifier ...
# Shift+Tab                    # 4. Mode Normal
# ... implémenter ...
/compact garde les modifs auth  # 5. Compacter
# ... continuer ...
/compact résumé final           # 6. Fin de journée

Concrètement, ce workflow permet de maintenir un contexte optimal sur une journée complète de 8 heures avec 40 à 60 interactions. Pour approfondir chaque étape, la fiche de référence rapide sur la gestion du contexte centralise toutes les ressources.

À retenir : démarrez en mode Plan, compactez régulièrement, séparez les domaines en sessions - ces trois principes couvrent 90 % des besoins.


Contenu rédigé par SFEIR Institute - organisme de formation IT spécialisé dans les technologies cloud et IA. Retrouvez nos formations sur sfeir.com.

Formation recommandée

Formation Claude Code

Maîtrisez Claude Code avec nos formateurs experts. Formation pratique, hands-on, directement applicable à vos projets.

Voir le programme