AI-инструменты
LLM & Security Gateway: один шлюз к моделям
Компании подключают десятки LLM, но теряют контроль над расходами, надёжностью и утечкой персональных данных в чужие модели.
Защита ПДн — не фильтр на выходе, а двусторонний контур: обфускация заменяет персональные данные на стабильные токены до модели и деобфускация подставляет исходные значения в ответ, поэтому модель и логи провайдера видят только обезличенный текст.
AI-контур
AI-ассистент должен брать действие, а не просто отвечать текстом
Сквозной тезис AI-блока: пилот с измеримым эффектом, приватные данные под контролем, действия агента журналируются, качество проходит evals перед расширением.
Ассистент ≠ чат-бот
Чат-бот отвечает; ассистент проверяет регламент, ходит в системы, фиксирует отклонение и предлагает следующий шаг.
Control plane
Реестр агентов, владелец, права, память, evals, trace logs, kill-switch и бюджет на уровне enterprise-контура.
Данные
RAG даёт ответ со ссылкой на источник; LLM Gateway обфусцирует ПДн до модели и восстанавливает после ответа.
Отраслевые решения
Что можно сделать на LLM & Security Gateway
Возможности
Возможности LLM & Security Gateway
Обфускация ПДн перед отправкой в модель
Имена, телефоны, адреса и номера карт заменяются на стабильные токены до отправки; модель и её логи не получают реальные данные клиента, риск GDPR-штрафа снимается
Деобфускация в ответе
Токены в ответе модели восстанавливаются в исходные значения по сессионной карте — пользователь видит реальные данные, которые ни разу не покидали периметр
Маршрутизация моделей по цене и качеству
Дешёвые запросы уходят на лёгкие модели, сложные — на фронтир; затраты падают на 45-85% без заметной потери качества
Бюджеты и лимиты по командам и проектам
Токен-лимиты на ключ, команду и проект останавливают перерасход до счёта от провайдера — конец сюрпризам в 40% сверх прогноза
Fallback и балансировка между провайдерами
При сбое или замедлении одной модели трафик автоматически уходит на резервную — ИИ-сервис не падает вместе с провайдером
Observability и атрибуция затрат
Каждый запрос логируется с моделью, токенами, латентностью и стоимостью через OpenTelemetry — видно, кто и сколько тратит, и где деградирует качество
Семантический кэш
Повторяющиеся запросы отдаются из кэша (40%+ попаданий в проде) — меньше счёт и латентность без потери качества ответа
Единое управление ключами и доступом
Ключи провайдеров хранятся в шлюзе, командам выдаются виртуальные ключи с мгновенным отзывом — секреты не текут в код приложений
Guardrails на вход и выход
Детект prompt injection и фильтрация контента до и после модели снижают риск утечки и токсичных ответов в проде
Подход
Как мы внедряем LLM & Security Gateway
Минимальная модификация ядра
Не форкаем и не патчим ядро LLM & Security Gateway. LLM & Security Gateway остаётся на стандартной обновляемой версии — бизнес-логику выносим в отдельные микросервисы рядом, поэтому обновления платформы не ломают ваши доработки.
Международные стандарты, а не велосипеды
Там, где есть зрелое международное решение, используем его, а не изобретаем собственный протокол или платформу. Прежде чем писать код — изучаем, как задача уже решена в индустрии.
Отчуждаемость
Решение слабосвязанное и задокументированное: его можно передать между командами и подрядчиками без переписывания. Вы не привязаны к нам.
Совместимость с AI
LLM & Security Gateway в AI-контуре
OpenAI-совместимый API
Единый эндпоинт в формате OpenAI Chat Completions — приложения переключаются на шлюз сменой base URL, без переписывания клиентского кода
Мультипровайдерность
OpenAI, Anthropic, Google, open-source и локальные модели за одним интерфейсом; смена модели — это изменение конфигурации маршрута, а не кода
OpenTelemetry и Prometheus
Телеметрия шлюза ложится рядом с прикладной в Datadog, Grafana, Splunk без кастомных адаптеров
Интеграция с RAG и агентами
Обфускация ПДн работает на уровне каждого вызова, поэтому защищает и одношаговые запросы, и многошаговые агентные цепочки и RAG-пайплайны
Self-hosted развёртывание
Шлюз и карта обфускации разворачиваются в периметре заказчика — ПДн и сессионные маппинги не выходят за контур компании
Проекты
Кейсы
AI-распознавание составов по штрихкоду
- Обработка ускорилась с 30 минут до 2 на партию из 10 изображений
- Точность распознавания состава составляет 80–95%
OSNO-VA: ИИ-бухгалтер
- Собрали AI-платформу
AI-аналитика рынка недвижимости
- Спроектировали ассистента
Контакты
Давайте обсудим ваш проект
Оставьте актуальные контакты и опишите задачу. Мы вернемся с уточняющими вопросами и предложением по следующему шагу.


