Дообучение моделей под задачи компании

Дообучение моделей (fine-tuning, LoRA) в KT.Team: когда промпта и RAG мало, как готовим датасет и меряем качество до/после, где живёт модель — контур и 152-ФЗ.

Обсудить проект

Наши клиенты

+10клиентов · Смотреть кейсы →

Как выбираем механизм: промпт → RAG → дообучение

Дешёвый механизм первым, дообучение — по доказанному пределу

Дешёвые механизмы

Промпт и правиладни

RAG на ваших документахбаза знаний со ссылкой на источник

Проверка

Evals на рабочих задачахметрики качества на контрольном наборе

Если предел доказан

LoRA-дообучение открытой моделидатасет из ваших данных

Дообучение включается только там, где дешёвые механизмы упёрлись в качество на доменных данных — так мы не переизобретаем велосипеды

Когда дообучение оправдано — и когда нет

Когда оправдано

Модель должна говорить терминологией и стилем вашего домена: юридические формулировки, техрегламенты, отраслевой жаргон.
Классификация, извлечение и разметка на ваших данных, где промпт и RAG стабильно не дотягивают до нужной точности.
Нужен стабильный формат ответа для интеграции: модель отвечает строго по схеме, а не «как получится».
Модель работает локально в закрытом контуре, и важно выжать качество из компактной открытой модели.

Когда не нужно

Знания меняются каждую неделю — свежие факты это задача RAG, а не весов модели.
Рабочих примеров мало: на десятках пар «вход → ответ» дообучение не улучшит качество измеримо.
Задача решается промптом или несколькими примерами в контексте — дешёвый механизм ещё не исчерпан.
Нужен «чат обо всём» без измеримой метрики качества — не с чего фиксировать критерий приёмки.

Оценить, где ИИ даст эффект в вашем процессе

Почта clients@kt.team Telegram @kt_team_blog

Что делаем: датасет, LoRA-адаптеры, метрики

01
Разбор процесса и evals
Фиксируем задачу и собираем контрольный набор рабочих примеров. Меряем базовое качество промпта и RAG — это точка отсчёта.
02
Датасет из рабочих данных
Собираем и чистим пары «вход → эталонный ответ» из документов, диалогов и учётных систем. Персональные данные обезличиваются до передачи в модель.
03
LoRA-дообучение открытой модели
Адаптеры вместо полного дообучения: быстрее и дешевле, процесс воспроизводим, а датасет и веса остаются собственностью компании.
04
Замер до и после
Та же метрика на том же контрольном наборе. Улучшение на evals — критерий приёмки, а не субъективное «стало лучше».
05
Передача в эксплуатацию
Модель встаёт в ваш контур, команда получает процесс обновления датасета и повторного дообучения — без зависимости от нас.

Где живёт модель: ваш контур и 152-ФЗ

Свой контур

Открытая модель с LoRA-адаптером работает на ваших мощностях — данные не покидают периметр компании.

LLM-шлюз для 152-ФЗ

Если часть трафика идёт во внешние модели, LLM-шлюз обезличивает персональные данные до модели и возвращает реальные значения в ответ.

RAG рядом, а не вместо

Дообучение отвечает за стиль, формат и доменные навыки; свежие факты подтягивает RAG-база знаний со ссылкой на источник.

Кейсы

Кейсы внедрения ИИ

Читать все

AI-распознавание составов по штрихкоду

Обработка ускорилась с 30 минут до 2 на партию из 10 изображений
Точность распознавания состава составляет 80–95%

#ai #cost #integration #manufacturing #pim

Подробнее

OSNO-VA: ИИ-бухгалтер

Собрали AI-платформу

#1c #ai #consulting #cost #integration

Подробнее

AI SDLC-контур для Fix Price

#ai #consulting #pim #retail

Подробнее

ИИзация по процессам

Один процесс — одна цена — оплата после результата

Дообучение — такой же процесс ИИзации: критерий приёмки фиксируем до старта в метриках качества на контрольном наборе, оплата — после принятого процесса. Ориентир цены — на странице цены и модели оплаты; экономику под ваши объёмы посчитайте в калькуляторе ИИзации.

Критерий приёмки — до старта
Оплата после принятия
Датасет и веса — ваши

Обсудить процесс под дообучение

Дообучение моделей под задачи компании

Клиенты и партнеры

Как выбираем механизм: промпт → RAG → дообучение

Когда дообучение оправдано — и когда нет

Когда оправдано

Когда не нужно

Оценить, где ИИ даст эффект в вашем процессе

Что делаем: датасет, LoRA-адаптеры, метрики

Разбор процесса и evals

Датасет из рабочих данных

LoRA-дообучение открытой модели

Замер до и после

Передача в эксплуатацию

Где живёт модель: ваш контур и 152-ФЗ

Свой контур

LLM-шлюз для 152-ФЗ

RAG рядом, а не вместо

Кейсы внедрения ИИ

AI-распознавание составов по штрихкоду

OSNO-VA: ИИ-бухгалтер

AI SDLC-контур для Fix Price

Один процесс — одна цена — оплата после результата

Обсудить решение: Дообучение моделей под задачи компании

Продолжить по теме

Связанные решения

Статьи по теме

Видео по теме

Новости по теме