316 — Déplacer le contexte entre modèles
Durée : ~35 min · Complexité : ⭐⭐ · Pré-requis : 107 — Choix de modèles, 311 — Tokens & contexte
Un seul modèle par session. Quand la phase suivante exige un autre modèle, transférez le contexte proprement — forkez la conversation, ou passez par un court fichier de spec — au lieu de changer de modèle en cours de session.
Objectif
À la fin de ce module, tu sais :
- Séparer une tâche en deux phases : planifier avec un modèle puissant, implémenter avec un plus léger.
- Transférer le contexte d’une phase à l’autre par fork de conversation (Option A).
- Transférer le contexte par un fichier de spec Markdown (Option B).
- Choisir entre les deux approches selon le besoin de contexte.
Ce que tu vas apprendre
- Le workflow en deux phases : planifier puis implémenter
- Option A — forker la conversation
- Option B — transfert en Markdown
- Quand choisir l’une plutôt que l’autre
Contenu pédagogique
La règle de base (Module 107) : un seul modèle par session, pour garder le cache de prompt chaud. Mais une tâche réelle a souvent deux phases qui n’appellent pas le même palier : planifier (raisonnement profond) puis implémenter (ingénierie du quotidien). Le défi : passer de l’une à l’autre sans changer de modèle en cours de session.
Le workflow : planifier avec un modèle puissant · implémenter avec un plus léger · un modèle par session.
Étape 1 — Planifier & architecturer
Palier : Raisonnement profond — Opus, GPT-5.5
Ouvre une session avec un modèle de raisonnement profond. Laisse-le explorer le problème, peser les compromis et produire le plan et l’architecture. C’est la réflexion coûteuse — fais-la une fois, fais-la bien.
À la fin de cette phase, tu as un plan prêt. Il faut maintenant le transmettre à la phase d’implémentation, qui tourne sur un modèle plus léger. Deux approches.
Option A — Forker la conversation
Dérive le chat actuel et change de modèle — le contexte suit.
- Arrive au point où le plan est prêt.
- Clique sur « Forker la conversation depuis ce point ».
- Sur la nouvelle branche, passe à Sonnet 4.6 et développe.
Forker la conversation depuis ce point
✅ Contexte complet hérité — rien à réexpliquer.
La nouvelle branche hérite de tout l’historique de raisonnement. Tu ne perds rien, mais tu emportes aussi tout le contexte — y compris ce dont la phase d’implémentation n’a pas besoin.
Option B — Transfert en Markdown
Persiste le plan, puis démarre une session propre et dédiée.
- Enregistre le plan dans un fichier de spec (ex.
plan.md). - Ouvre une toute nouvelle session.
- Pointe Sonnet 4.6 vers le fichier et implémente.
save → plan.md
✅ Contexte minimal — le fichier .md fait foi.
La nouvelle session démarre vierge, avec pour seul contexte le fichier de spec. Le cache de prompt repart de zéro mais reste minimal et propre : aucun bruit hérité de la phase de planification.
Étape 2 — Implémenter
Palier : Ingénierie du quotidien — Sonnet 4.6
Un seul modèle pour toute la session d’implémentation. Le cache de prompt reste chaud, la sortie reste cohérente et tu dépenses bien moins de tokens — exactement ce que changer de modèle en cours de session casserait.
Fork ou Markdown : comment choisir
| Critère | Option A — Fork | Option B — Markdown |
|---|---|---|
| Contexte transmis | Complet (tout l’historique) | Minimal (le fichier .md) |
| Réexplication | Aucune | Aucune (le .md fait foi) |
| Bruit hérité | Possible | Aucun |
| Idéal quand… | le raisonnement détaillé compte pour l’implémentation | le plan se résume proprement en un document |
Exercice
Énoncé — En 20 minutes, tu vas exécuter le workflow en deux phases sur une petite feature.
Étapes guidées :
- Ouvre une session avec un modèle de raisonnement profond et fais-lui produire un plan d’implémentation pour une feature simple.
- Transmets le plan par Option B : enregistre-le dans
plan.md. - Ouvre une nouvelle session, pointe un modèle d’ingénierie du quotidien vers
plan.mdet implémente. - Recommence avec Option A (fork) sur une autre feature, et compare la sensation : contexte hérité vs contexte minimal.
Critère de réussite : tu as livré une feature en gardant un seul modèle par session, sans jamais changer de modèle en cours de session.
Validation
Tu peux passer au module suivant si :
- Tu sais découper une tâche en phase de planification et phase d’implémentation.
- Tu sais forker une conversation pour changer de modèle (Option A).
- Tu sais transférer un plan via un fichier
.mdvers une session propre (Option B). - Tu sais expliquer quel transfert choisir selon le besoin de contexte.
Pour aller plus loin
- Module 317 — Orchestrer des subagents — laisser un runtime gérer le transfert de contexte automatiquement.
- Module 318 — Mesurer & optimiser sa consommation — vérifier l’effet du cache de prompt sur la facture.
Source
Contenu issu du retour d’expérience d’Ousmane BARRY, MVP Microsoft Foundry — guide pratique « Développement assisté par IA » (publication LinkedIn).
Suivant : 317 — Orchestrer des subagents