Автоматическое резюмирование контекста

Когда ваш разговор приближается к пределу контекстного окна модели, Careti автоматически резюмирует его, чтобы освободить место и продолжить работу.

Функция Auto-compact сжатия контекста разговора

Как это работает

Careti контролирует использование токенов во время вашего разговора. Когда вы приближаетесь к пределу, он:

Создаёт комплексный краткий обзор всего, что произошло
Сохраняет все технические детали, изменения кода и решения
Заменяет историю разговора с кратким обзором
Продолжает именно с того места, где он остановился

Вы увидите вызов инструмента резюмирования, когда это произойдёт, показывающий общую стоимость, как и любой другой вызов API в представлении чата.

Почему это важно

Ранее Careti обрезал более старые сообщения при достижении пределов контекста. Это означало потерю важного контекста с более ранней части разговора.

Теперь с резюмированием:

Все технические решения и паттерны кода сохраняются
Изменения файлов и контекст проекта остаются неповреждёнными
Careti помнит всё, что он сделал
Вы можете работать с гораздо большими проектами без прерываний

💡Tip

Резюмирование контекста работает красиво в синергии с Focus Chain. Когда Focus Chain включен, списки задач сохраняются при резюмировании. Это означает, что Careti может работать над долгосрочными задачами, которые охватывают несколько контекстных окон, оставаясь на курсе со списком задач, направляющим его через каждый сброс.

Технические детали

Резюмирование происходит через ваш настроенный поставщик API, используя ту же модель, которую вы уже используете. Оно использует кэширование подсказок для минимизации затрат.

Careti использует подсказку резюмирования для запроса краткого обзора разговора.
После создания краткого обзора Careti заменяет историю разговора подсказкой продолжения, которая просит Careti продолжить работу и предоставляет краткий обзор как контекст.

Различные модели имеют различные пороги окна контекста для автоматического резюмирования. Вы можете увидеть, как пороги определяются в context-window-utils.ts.

Соображения по затратам

Резюмирование использует ваш существующий кэш подсказок из разговора, поэтому оно стоит примерно столько же, сколько любой другой вызов инструмента.

Так как большинство входных токенов уже кэшированы, вы в основном платите за генерацию краткого обзора (выходные токены), что делает это очень экономичным.

Восстановление контекста с контрольными точками

Вы можете использовать контрольные точки для восстановления состояния вашей задачи до резюмирования. Это означает, что вы никогда действительно не теряете контекст — вы всегда можете откатиться к предыдущим версиям вашего разговора.

ℹ️Note

Редактирование сообщения до вызова инструмента резюмирования будет работать аналогично контрольной точке, позволяя вам восстановить разговор к этому моменту.

Поддержка моделей следующего поколения

Auto Compact использует передовое резюмирование на основе LLM, которое, как мы выяснили, значительно лучше работает для моделей следующего поколения. Мы в настоящее время поддерживаем эту функцию для следующих моделей:

Claude 4 series
Gemini 2.5 series
GPT-5
Grok 4

ℹ️Note

При использовании других моделей Careti автоматически возвращается к стандартному методу обрезки контекста на основе правил, даже если Auto Compact включен в настройках.

Как это работает​

Почему это важно​

💡Tip

Технические детали​

Соображения по затратам​

Восстановление контекста с контрольными точками​

ℹ️Note

Поддержка моделей следующего поколения​

ℹ️Note

Как это работает

Почему это важно

Технические детали

Соображения по затратам

Восстановление контекста с контрольными точками

Поддержка моделей следующего поколения