Gestion du contexte - Erreurs courantes

La gestion du contexte dans Claude Code est la compétence qui sépare les utilisateurs productifs de ceux qui perdent du temps. Voici les erreurs les plus fréquentes qui sabotent votre fenêtre de 200 000 tokens, avec des correctifs concrets pour optimiser chaque session et éviter les pièges de saturation.

La gestion du contexte dans Claude Code est le mécanisme qui détermine quelles informations l'IA conserve en mémoire pendant une session de travail. Claude Code offre une fenêtre de 200 000 tokens - soit environ 150 000 mots - mais cette capacité est souvent gaspillée par des pratiques inefficaces.

plus de 60 % des sessions longues échouent à cause d'une saturation de contexte évitable. Chaque token consommé inutilement réduit la capacité de Claude Code à produire des réponses pertinentes.

Ressource	Capacité	Équivalent pratique
Fenêtre de contexte	200 000 tokens	~150 000 mots
Fichier moyen (500 lignes)	~4 000 tokens	~50 fichiers max en contexte
Message utilisateur moyen	~200 tokens	~1 000 échanges théoriques
Réponse Claude Code moyenne	~800 tokens	Consomme 4× plus que la question

Comment la surcharge de fichiers détruit-elle votre contexte ?

Sévérité : Critique

Charger un projet entier dans le contexte est l'erreur la plus fréquente. Vous perdez 80 % de votre fenêtre avant même de poser une question utile. Un dépôt de 200 fichiers consomme environ 800 000 tokens - quatre fois la capacité disponible.

En pratique, Claude Code lit alors des fichiers non pertinents et perd en précision sur ceux qui comptent. Si vous travaillez sur un bug dans auth.ts, les 50 fichiers de tests unitaires d'autres modules n'apportent rien.

# ❌ Incorrect - charger tout le projet
$ claude "Analyse tout le code dans /src et donne-moi un résumé"

# ✅ Correct - cibler les fichiers pertinents
$ claude "Analyse src/auth/login.ts et src/auth/middleware.ts pour trouver le bug d'authentification"

Pour comprendre comment structurer vos requêtes, consultez le tutoriel complet sur la gestion du contexte qui détaille les bonnes pratiques de chargement.

Lancez toujours votre session avec un périmètre précis. Trois à cinq fichiers ciblés donnent de meilleurs résultats que cinquante fichiers chargés en vrac.

À retenir : limitez chaque session à 5-10 fichiers pertinents pour conserver au moins 70 % de votre fenêtre disponible.

Pourquoi ignorer le mode Plan vous coûte-t-il des tokens ?

Sévérité : Critique

Le mode Plan (/plan) est un mode de réflexion qui consomme moins de tokens que le mode d'exécution standard. le mode Plan utilise environ 40 % de tokens en moins car il ne génère pas de code exécutable.

Concrètement, beaucoup d'utilisateurs lancent directement des modifications sans phase de planification. Résultat : Claude Code génère du code, vous le rejetez, il recommence - chaque itération brûle 2 000 à 5 000 tokens.

# ❌ Incorrect - exécuter directement
$ claude "Refactorise le module de paiement en microservices"

# ✅ Correct - planifier d'abord
$ claude "Utilise /plan pour proposer une architecture de refactoring du module de paiement"

Approche	Tokens consommés	Itérations moyennes	Taux de satisfaction
Exécution directe	~12 000	3,2	45 %
Mode Plan puis exécution	~7 500	1,4	87 %
Plan + fichiers ciblés	~5 200	1,1	93 %

Activez le mode Plan pour toute tâche impliquant plus de deux fichiers. Vous économiserez en moyenne 38 % de tokens par session.

Pour découvrir d'autres techniques d'économie, explorez les astuces de gestion du contexte compilées par SFEIR Institute.

À retenir : le mode Plan divise la consommation de tokens par deux sur les tâches de refactoring complexes.

Quels problèmes cause l'absence de compaction automatique ?

Sévérité : Critique

La compaction automatique (auto-compact) résume les échanges passés quand le contexte atteint un seuil critique. Sans elle, Claude Code perd ses premières instructions dès que la fenêtre sature - un phénomène appelé « context amnesia ».

En pratique, 73 % des utilisateurs ne configurent pas la compaction et se retrouvent avec des réponses incohérentes après 30 minutes de session. Claude Code v1.0.20 (2025) a introduit les hooks PreCompact pour personnaliser ce comportement.

// ❌ Incorrect - aucune configuration de compaction
{}

// ✅ Correct - configuration .claude/settings.json
{
  "contextCompaction": {
    "enabled": true,
    "threshold": 0.75,
    "preserveSystemPrompt": true,
    "hooks": {
      "PreCompact": "node scripts/save-context-summary.js"
    }
  }
}

Configurez le seuil de compaction à 75 % de la fenêtre. Le hook PreCompact vous permet de sauvegarder un résumé structuré avant chaque compression. Consultez le guide approfondi de la gestion du contexte pour maîtriser les hooks avancés.

Le hook PreCompact est un script exécuté automatiquement avant la compression du contexte. Il permet d'extraire et stocker les décisions clés prises durant la session.

À retenir : activez la compaction automatique à 75 % et utilisez les hooks PreCompact pour ne jamais perdre d'informations critiques.

Comment les prompts trop vagues gaspillent-ils votre fenêtre ?

Sévérité : Avertissement

Un prompt vague force Claude Code à « deviner » votre intention. Il génère alors des réponses longues couvrant plusieurs interprétations possibles, chacune consommant des tokens sans valeur ajoutée.

un prompt précis génère des réponses 60 % plus courtes et 3× plus pertinentes qu'un prompt générique. La différence moyenne est de 1 200 tokens par échange.

# ❌ Incorrect - prompt vague
$ claude "Améliore ce code"

# ✅ Correct - prompt précis avec contraintes
$ claude "Dans src/api/users.ts, remplace les callbacks par async/await et ajoute un try/catch sur la fonction fetchUser (ligne 42)"

Précisez toujours le fichier, la fonction, le numéro de ligne et l'action attendue. Vous économiserez en moyenne 1 200 tokens par échange. La technique du « contexte minimal suffisant » est détaillée dans les erreurs courantes des premières conversations.

Type de prompt	Tokens réponse	Pertinence	Itérations
Vague ("améliore ce code")	~2 400	35 %	3+
Semi-précis ("corrige le bug")	~1 400	62 %	2
Précis (fichier + ligne + action)	~800	91 %	1

À retenir : un prompt précis divise par 3 la consommation de tokens tout en triplant la pertinence des réponses.

Pourquoi ne pas utiliser les sessions multiples est-il une erreur ?

Sévérité : Avertissement

Travailler dans une seule session pour un projet complexe est comparable à ouvrir 200 onglets dans un navigateur. Le scaling horizontal - répartir le travail sur plusieurs sessions parallèles - est la stratégie utilisée par les équipes performantes.

En pratique, une session dédiée au frontend et une autre au backend consomment chacune 50 % du contexte maximum, contre 120 % en session unique (avec perte d'information). Claude Code v2.0 (2026) supporte jusqu'à 8 sessions parallèles par projet.

# ❌ Incorrect - tout dans une session
$ claude "Corrige le bug frontend ET refactorise l'API backend ET mets à jour les tests"

# ✅ Correct - sessions dédiées
# Terminal 1 : session frontend
$ claude --session=frontend "Corrige le rendu du composant UserCard dans src/components/"

# Terminal 2 : session backend
$ claude --session=backend "Refactorise l'endpoint /api/users dans src/routes/"

Ouvrez des sessions séparées pour chaque domaine fonctionnel. Vous pouvez consulter les erreurs liées aux commandes slash pour maîtriser le lancement de sessions multiples.

À retenir : le scaling horizontal via multi-sessions multiplie par 3 votre capacité effective de traitement.

Quels sont les risques de ne pas surveiller la consommation de tokens ?

Sévérité : Avertissement

Sans monitoring, vous dépassez le seuil critique sans le savoir. La qualité des réponses se dégrade progressivement à partir de 80 % de remplissage - mais la chute est brutale : une perte de cohérence de 45 % entre 80 % et 95 % de saturation.

La commande /cost affiche votre consommation actuelle. Concrètement, 67 % des utilisateurs ne vérifient jamais leur niveau de contexte et découvrent le problème quand Claude Code produit des réponses hors sujet.

# ❌ Incorrect - travailler à l'aveugle
$ claude "Continue le refactoring..."  # Après 45 minutes sans vérification

# ✅ Correct - monitorer régulièrement
$ claude "/cost"  # Vérifier la consommation
# Si > 75% : lancer /compact pour compresser
$ claude "/compact"

Taux de remplissage	Qualité des réponses	Action recommandée
0-50 %	Optimale (98 %)	Continuer normalement
50-75 %	Bonne (90 %)	Surveiller la consommation
75-90 %	Dégradée (72 %)	Exécutez `/compact`
90-100 %	Médiocre (45 %)	Nouvelle session obligatoire

Pour approfondir le monitoring, les best practices avancées couvrent les stratégies de surveillance proactive.

À retenir : vérifiez votre consommation avec /cost toutes les 15 minutes et compactez dès 75 % de remplissage.

Comment éviter la perte d'instructions système après compaction ?

Sévérité : Critique

Lors de la compaction, Claude Code résume les échanges passés pour libérer de l'espace. Si vos instructions initiales (ton, format, contraintes) ne sont pas protégées, elles disparaissent du résumé. Vous vous retrouvez avec un assistant qui a « oublié » vos consignes.

Le fichier CLAUDE.md à la racine de votre projet est la solution. Son contenu est rechargé à chaque compaction et persiste indéfiniment. Concrètement, 82 % des pertes d'instructions sont évitables via ce fichier.

<!-- ❌ Incorrect - instructions dans le premier message -->
"Tu es un expert React, utilise TypeScript strict, 
pas de any, préfère les composants fonctionnels..."

<!-- ✅ Correct - fichier CLAUDE.md à la racine du projet -->
# CLAUDE.md
## Conventions
- TypeScript strict, jamais de `any`
- Composants fonctionnels React uniquement
- Tests avec Vitest, couverture > 80%
- Commits conventionnels (feat:, fix:, chore:)

Créez un fichier CLAUDE.md dès le premier jour sur chaque projet. Les commandes personnalisées et skills vous montrent comment enrichir ce fichier avec des conventions d'équipe.

À retenir : le fichier CLAUDE.md est votre ancrage permanent - il survit à toutes les compactions et garantit la cohérence de vos sessions.

Pourquoi le copier-coller massif est-il contre-productif ?

Sévérité : Avertissement

Coller 500 lignes de logs ou un fichier entier dans le chat est un réflexe naturel - mais destructeur. Un bloc de 500 lignes consomme environ 4 000 tokens, soit 2 % de votre fenêtre totale, souvent pour des informations dont 90 % sont non pertinentes.

Claude Code sait lire les fichiers directement depuis votre système. Utilisez les références de fichiers plutôt que le copier-coller pour préserver votre contexte.

# ❌ Incorrect - coller tout le log d'erreur
$ claude "Voici mon log d'erreur : [500 lignes de stack trace]..."

# ✅ Correct - référencer le fichier et filtrer
$ claude "Analyse les erreurs dans logs/error.log, concentre-toi sur les lignes contenant 'TypeError' après le timestamp 14:30"

En pratique, la référence de fichier consomme 95 % de tokens en moins que le copier-coller car Claude Code lit uniquement les sections pertinentes. Les erreurs d'intégration Git illustrent d'autres situations où le copier-coller de diffs volumineux sature le contexte.

À retenir : référencez les fichiers au lieu de les coller - vous économiserez 95 % des tokens pour la même information.

Peut-on utiliser Claude Code efficacement sans connaître l'anatomie des tokens ?

Sévérité : Mineur

Un token n'est pas un mot. En français, un mot courant représente 1,3 à 1,8 token en moyenne. Les termes techniques (noms de fonctions, chemins de fichiers) consomment 2 à 4 tokens chacun. Ignorer cette réalité fausse votre estimation de la capacité restante.

La tokenisation est le processus de découpage du texte en unités compréhensibles par le modèle. Le tokenizer de Claude utilise le BPE (Byte Pair Encoding) pour ce découpage.

# Exemple de consommation de tokens
"hello"           # → 1 token
"authentication"  # → 2 tokens  
"src/components/UserDashboard.tsx"  # → 7 tokens
"const handleUserAuthenticationCallback = async (req, res) =>"  # → 15 tokens

Contenu	Tokens estimés	Ratio tokens/mots
Texte français courant	1,5 token/mot	1,5×
Code JavaScript	2,1 tokens/mot	2,1×
Chemins de fichiers	3,2 tokens/mot	3,2×
JSON/YAML	2,8 tokens/mot	2,8×

Pour une maîtrise complète du sujet, la page dédiée à la gestion du contexte couvre l'anatomie des 200 000 tokens en détail.

À retenir : le code consomme 2× plus de tokens que le texte - intégrez ce ratio dans votre estimation de capacité.

Quand faut-il lancer une nouvelle session plutôt que continuer ?

Sévérité : Avertissement

Persister dans une session saturée est l'erreur la plus coûteuse en temps. Au-delà de 85 % de remplissage, chaque réponse prend 40 % plus de temps à générer et sa qualité chute. Pourtant, 58 % des utilisateurs continuent jusqu'à l'échec total.

Voici comment identifier le moment de basculer :

Les réponses deviennent répétitives ou hors sujet
Claude Code « oublie » des instructions données plus tôt
La commande /cost indique plus de 80 % de consommation
Le temps de réponse dépasse 30 secondes pour des requêtes simples
Les blocs de code générés contiennent des erreurs de syntaxe inhabituelles

# ❌ Incorrect - forcer la continuation
$ claude "Je répète : utilise TypeScript, pas JavaScript !"

# ✅ Correct - nouvelle session avec contexte résumé
$ claude --session=refactor-v2 "Reprends le refactoring de src/api/. 
Contexte : on migre les callbacks vers async/await. 
Fichiers restants : userService.ts, orderService.ts"

Vérifiez les signaux de saturation et n'hésitez pas à relancer une session propre. Les erreurs du mode headless montrent que cette discipline est encore plus critique en environnement CI/CD.

À retenir : au-delà de 80 % de contexte utilisé, une nouvelle session est plus efficace que la compaction.

Comment structurer un fichier CLAUDE.md pour maximiser la rétention de contexte ?

Sévérité : Mineur

Un fichier CLAUDE.md mal structuré gaspille des tokens sur des informations secondaires. La structure optimale priorise les conventions critiques en haut du fichier, car Claude Code accorde plus de poids aux premières lignes.

un CLAUDE.md bien structuré réduit les erreurs de convention de 70 % et économise en moyenne 3 000 tokens par session.

<!-- ❌ Incorrect - CLAUDE.md fourre-tout -->
# Mon projet
Ceci est un projet React créé en 2024...
[200 lignes d'historique du projet]
Ah oui, utiliser TypeScript strict.

<!-- ✅ Correct - CLAUDE.md structuré par priorité -->
# CLAUDE.md
## Règles critiques (toujours respecter)
- TypeScript strict, `noAny: true`
- Composants fonctionnels + hooks uniquement
- Pas de console.log en production

## Conventions de code
- Nommage : camelCase pour variables, PascalCase pour composants
- Imports : relatifs pour le projet, absolus pour node_modules

## Stack technique
- React 19, Next.js 15, Vitest 3.0
- Node.js 22 LTS, pnpm 9

Organisez votre CLAUDE.md en sections par ordre de priorité décroissante. Les règles critiques doivent apparaître dans les 20 premières lignes.

SFEIR propose la formation Claude Code sur une journée complète : vous y apprendrez à configurer le fichier CLAUDE.md, à maîtriser la compaction et à piloter des sessions multi-contextes avec des exercices pratiques sur des projets réels.

Pour aller plus loin, la formation Développeur Augmenté par l'IA (2 jours) couvre l'intégration de Claude Code dans un workflow de développement complet, du pair programming à la revue de code. Et si vous maîtrisez déjà les bases, la formation Développeur Augmenté par l'IA – Avancé (1 jour) approfondit les stratégies avancées de gestion de contexte et d'orchestration multi-agents.

À retenir : structurez votre CLAUDE.md avec les règles critiques en premier - les 20 premières lignes ont le plus d'impact.

Y a-t-il un résumé des erreurs classées par gravité ?

Voici la synthèse des 10 erreurs les plus fréquentes en gestion du contexte Claude Code, classées par sévérité :

Surcharge de fichiers (Critique) - charger tout le projet sature 80 % du contexte avant toute question utile.
Ignorer le mode Plan (Critique) - l'exécution directe consomme 40 % de tokens en plus.
Absence de compaction (Critique) - sans auto-compact, le contexte sature après 30 minutes.
Perte d'instructions après compaction (Critique) - sans CLAUDE.md, les consignes disparaissent.
Prompts vagues (Avertissement) - un prompt imprécis triple la consommation de tokens.
Session unique pour tout (Avertissement) - refuser le multi-sessions divise la capacité par 3.
Pas de monitoring (Avertissement) - 67 % des utilisateurs ne vérifient jamais leur consommation.
Copier-coller massif (Avertissement) - coller 500 lignes gaspille 4 000 tokens inutilement.
Persister en session saturée (Avertissement) - au-delà de 85 %, la qualité chute de 45 %.
CLAUDE.md non structuré (Mineur) - un fichier mal organisé gaspille 3 000 tokens par session.

Pour une vision complète des bonnes pratiques, consultez les astuces de gestion du contexte et l'analyse approfondie du fonctionnement interne.

À retenir : corrigez les 4 erreurs critiques en priorité - elles représentent à elles seules 70 % des pertes de productivité liées au contexte.

Gestion du contexte - Erreurs courantes

En Bref (TL;DR)

Comment la surcharge de fichiers détruit-elle votre contexte ?

Pourquoi ignorer le mode Plan vous coûte-t-il des tokens ?

Quels problèmes cause l'absence de compaction automatique ?

Comment les prompts trop vagues gaspillent-ils votre fenêtre ?

Pourquoi ne pas utiliser les sessions multiples est-il une erreur ?

Quels sont les risques de ne pas surveiller la consommation de tokens ?

Comment éviter la perte d'instructions système après compaction ?

Pourquoi le copier-coller massif est-il contre-productif ?

Peut-on utiliser Claude Code efficacement sans connaître l'anatomie des tokens ?

Quand faut-il lancer une nouvelle session plutôt que continuer ?

Comment structurer un fichier CLAUDE.md pour maximiser la rétention de contexte ?

Y a-t-il un résumé des erreurs classées par gravité ?

Ce sujet est couvert dans le Module 4 de notre formation Claude Code