Résumé automatique du contexte

Lorsque votre conversation approche de la limite de la fenêtre de contexte du modèle, Careti la résume automatiquement pour libérer de l'espace et continuer à travailler.

Fonctionnalité Auto-compact condensant le contexte de la conversation

Comment ça marche

Careti surveille l'utilisation des tokens pendant votre conversation. Lorsque vous approchez de la limite, il :

Crée un résumé complet de tout ce qui s'est passé
Conserve tous les détails techniques, les modifications de code et les décisions
Remplace l'historique de la conversation par le résumé
Continue exactement là où il s'était arrêté

Vous verrez un appel d'outil de résumé lorsque cela se produit, affichant le coût total comme tout autre appel d'API dans la vue de chat.

Pourquoi c'est important

Auparavant, Careti tronquait les messages plus anciens lorsqu'il atteignait les limites de contexte. Cela signifiait perdre un contexte important du début de la conversation.

Désormais, avec la Summarization :

Toutes les décisions techniques et les modèles de code sont conservés
Les modifications de fichiers et le contexte du projet restent intacts
Careti se souvient de tout ce qu'il a fait
Vous pouvez travailler sur des projets beaucoup plus vastes sans interruption

💡Tip

La Context Summarization est en parfaite synergie avec Focus Chain. Lorsque Focus Chain est activé, les listes de tâches persistent à travers les summarizations. Cela signifie que Careti peut travailler sur des tâches à long terme qui s'étendent sur plusieurs fenêtres de contexte tout en restant sur la bonne voie grâce à la liste de tâches qui le guide à travers chaque réinitialisation.

Détails techniques

La summarization s'effectue via votre fournisseur d'API configuré en utilisant le même modèle que celui que vous utilisez déjà. Elle exploite le caching des prompts pour minimiser les coûts.

Careti utilise un summarization prompt pour demander un résumé de la conversation.
Une fois le résumé généré, Careti remplace l'historique de la conversation par un continuation prompt qui demande à Careti de continuer à travailler et fournit le résumé comme contexte.

Différents modèles ont différents seuils de fenêtre de contexte pour le déclenchement de l'auto-summarization. Vous pouvez voir comment les seuils sont déterminés dans context-window-utils.ts.

Considérations de coût

La Summarization exploite votre cache de prompts existant de la conversation, elle coûte donc à peu près le même prix que tout autre appel d'outil.

Étant donné que la plupart des tokens d'entrée sont déjà mis en cache, vous payez principalement pour la génération du résumé (tokens de sortie), ce qui la rend très rentable.

Restauration du contexte avec des Checkpoints

Vous pouvez utiliser des checkpoints pour restaurer l'état de votre tâche d'avant une summarization. Cela signifie que vous ne perdez jamais vraiment le contexte - vous pouvez toujours revenir à des versions antérieures de votre conversation.

ℹ️Note

La modification d'un message avant un appel d'outil de summarization fonctionnera de la même manière qu'un checkpoint, vous permettant de restaurer la conversation à ce point.

Prise en charge des modèles de nouvelle génération

Auto Compact utilise une summarization avancée basée sur LLM qui, selon nos constatations, fonctionne beaucoup mieux pour les modèles de nouvelle génération. Nous prenons actuellement en charge cette fonctionnalité pour les modèles suivants :

Claude 4 series
Gemini 2.5 series
GPT-5
Grok 4

ℹ️Note

Lorsque vous utilisez d'autres modèles, Careti revient automatiquement à la méthode standard de troncature de contexte basée sur des règles, même si Auto Compact est activé dans les paramètres.

Comment ça marche​

Pourquoi c'est important​

💡Tip

Détails techniques​

Considérations de coût​

Restauration du contexte avec des Checkpoints​

ℹ️Note

Prise en charge des modèles de nouvelle génération​

ℹ️Note

Comment ça marche

Pourquoi c'est important

Détails techniques

Considérations de coût

Restauration du contexte avec des Checkpoints

Prise en charge des modèles de nouvelle génération