Цены за 1 млн токенов (input / output), если не указано иное. Для open-weight моделей цена API у провайдеров приведена как ориентир — главное в них лицензия, потому что веса можно крутить on-prem. «On-prem / РФ-контур» — возможно ли развернуть модель внутри периметра заказчика. Цены не-Anthropic вендоров — по их публичным прайсам; сверяйте с первоисточником на дату (см. блок «Источники»).
| Модель | Вендор | Цена in/out (1М) | Контекст | Лицензия | On-prem / РФ-контур | Данные в РФ / 152-ФЗ | Под что брать |
| **Fable 5** | Anthropic | $10 / $50 | 1M | Closed | Нет | Нет | Самый тяжёлый long-horizon reasoning и агентика |
| **Claude Opus 4.8** | Anthropic | $5 / $25 | 1M | Closed | Нет | Нет | Лучший дефолт «цена/интеллект» среди frontier-closed |
| **GPT-5.5** | OpenAI | ~$5 / $30\* | ~1M+ | Closed | Нет | Нет | Большой контекст, дешёвый кэш и batch |
| **DeepSeek V4** | DeepSeek | Flash $0,14 / $0,28; Pro $0,44 / $0,87 | 1M | **MIT** | **Да** | Да, если развернуть в РФ | Код и длинный контекст в контуре заказчика |
| **Qwen 3.x** | Alibaba | open-weight (Apache 2.0) | 128–256K | **Apache 2.0** (младшие); Max — closed | **Да** (235B/Coder); Max — нет | Да, если развернуть | Код, мультиязычность, дешёвый on-prem |
| **Gemma 4** | Google | self-host / ~$0,06–0,30 хостед | 256K | open weights\* | **Да** | Да, если развернуть | Дешёвый массовый инференс в контуре |
| **Llama 4** | Meta | self-host | 1M–10M | Community License\*\* | **Да** | Да, если развернуть | Зрелая экосистема, очень длинный контекст |
| **GigaChat** | Сбер | 0,065–0,65 ₽ / 1К ток. | 128K (256K open) | Closed; GigaChat 3 — **MIT** | Облако в РФ; open-weight — да | **Да, ДЦ в РФ** | RU-задачи без VPN; on-prem через GigaChat 3 |
| **YandexGPT** | Яндекс | ~0,2–0,4 ₽ / 1К ток. | 32K (Lite) / до 128K (Pro) | Closed; 5 Lite — open (кастомная) | Облако в РФ; Lite 8B — да | **Да, заявлено ФЗ-152** | RU-задачи без VPN, оплата в рублях |
\* Цены и контекст GPT-5.5 — по публичным заявлениям OpenAI; сверяйте с актуальным прайсом на developers.openai.com на дату. Конкретные множители (порог длинного контекста, наценка за регион) указывайте только со ссылкой на страницу прайса. \* Лицензия Gemma 4 разрешает коммерческое использование, но исторически не полностью OSI-open (есть use-policy ограничения).
Перед on-prem читайте текст лицензии на HuggingFace. \*\* Llama 4 Community License — open-weight с ограничениями (AUP, порог 700 млн MAU). Это «open-weight с оговорками лицензии», а не классический open-source. ### Важные оговорки по версиям (факт-чек) Названия в задачах сравнения и реальность июня 2026 расходятся в нескольких местах — пишем как есть: - Qwen Max — не open-weight. Qwen3-Max (и более новый 3.7-Max) — проприетарные API-only модели Alibaba; веса не выкладываются.
Open-weight у Alibaba — это младшие Qwen3 (например, Qwen3-235B-A22B и Qwen3-Coder-480B, Apache 2.0). Для блока «развернуть в контуре» брать именно их. Источник: Qwen — Wikipedia. - Последняя open-weight Llama — это Llama 4. Самая свежая модель Meta (Muse Spark, апрель 2026) — закрытая, без открытых весов. Для open-weight-сравнения корректна именно Llama 4 (Scout/Maverick).
Источник: VentureBeat. - Fable 5 — это Anthropic. Подтверждено официальным анонсом Anthropic от 09.06.2026 и API-справочником (model ID `claude-fable-5`). Это самая мощная широко доступная модель Anthropic выше линейки Opus. - DeepSeek V4 — open weights под MIT. Самая чистая лицензия из всех open-weight в таблице: можно развернуть в РФ-контуре без оговорок про MAU.
Источник: DeepSeek docs. - GigaChat on-prem. Публичные источники подтверждают облако с обработкой в ДЦ РФ под 152-ФЗ и наличие open-weight GigaChat 3 (MIT). Поставку проприетарного облачного GigaChat «коробкой» на on-prem отдельно уточняйте у Сбера перед публичными обещаниями.