Контекст должен быть как досье для решения, а не как архив всего проекта.
-
Токены дорожают не в момент генерации, а раньше: когда в модель кладут лишний архив, длинный лог, повторяющиеся правила, слишком широкий контекст и просят большой отчёт там, где нужен ответ в три строки.
-
Поэтому мы снижаем стоимость не одним «промптом», а устройством рабочего процесса.
-
Мы сравниваем не цену миллиона токенов, а стоимость готового результата: сколько контекста, вызовов, итераций и ручной доработки нужно, чтобы получить ответ нужного качества.
-
Эта логика продолжает наш разбор выбора LLM под процесс и бюджет: модель важна, но экономику чаще решает маршрут задачи.


