Линза Карпатого: понимание против исполнения

Разбор идей Андрея Карпатого: ИИ как «дух», десятилетие агентов, понимание важнее исполнения — и что из этого следует для бизнеса.

  • Не новая форма жизни, а «дух»
  • Базовая формула отношения к «духу»
  • Почему «дух» не превращается в разум по щелчку
  • Чего агенту не хватает до сотрудника
  1. Карпатый строит ИИ и одновременно публично его описывает: один из основателей-членов команды OpenAI, годы руководства ИИ и автопилотом в Tesla, автор учебных материалов, на которых выросло поколение инженеров (micrograd, nanoGPT).

  2. По его публичным выступлениям видно нежелание раздувать ожидания: там, где индустрия обещает «AGI через год», он говорит «десятилетие».

  3. Это не пересказ его интервью, а попытка вытащить из его публичной позиции один цельный фрейм и разложить его так, чтобы им можно было пользоваться при решениях.

  4. Фрейм держится на трёх параллельных утверждениях: понимание бьёт исполнение, реальность бьёт таймлайны, инженерия бьёт нарратив.

  5. Три раза одна и та же ошибка — лёгкое и эффектное принимают за трудное и реальное.

  6. Всё ниже подано как публичная позиция Карпатого, а не как установленный факт о мире; биографические частности я намеренно опускаю.

Не новая форма жизни, а «дух»

Индустрия любит аналогию ИИ с живым мозгом — «цифровое животное», «новый вид интеллекта».

Карпатый эту метафору отводит — и приводит механизм, почему она неверна.

Зебрёнок рождается и через минуты бежит: инстинкты вшиты эволюцией, обучение поверх минимально.

Большая языковая модель устроена наоборот.

Она берёт гигантский корпус человеческого текста и учится его имитировать.

Это не существо со своей биологией, а, по его формулировке, эфирный призрак — «дух», который мимикрирует под человека, потому что собран из человеческих следов, но внутри устроен иначе.

Вывод здесь не философский, а рабочий.

Если держать правильную модель того, чем ИИ является, работаешь с ним эффективнее.

На «духа» бессмысленно кричать, давить срочностью, мотивировать, хвалить за старание — у него нет страха, азарта, желания понравиться, воли, инициативы, любопытства. Всё, что в человеке порождает инициативу и заботу «туда ли мы идём», человек обязан держать на себе и встраивать в процесс явно: проверку, остановку, сверку направления. ИИ — почти идеальное зеркало человеческого текста, и здесь же скрыт риск: мы склонны принимать собственное отражение за собеседника.

Карпатый описывает эту ловушку на себе — желание заслужить «одобрение» модели, когда ассистент будто «теплеет» на удачную идею.

Это показывает природу духа, а не его волю.

Почему «дух» не превращается в разум по щелчку

  1. Здесь же лежит причина его осторожности по срокам.

  2. Современные системы во многом дотягивают обучением с подкреплением (RL). У RL есть встроенная слабость: награда часто одна и приходит в конце длинной цепочки действий.

  3. При положительном итоге апвейтятся все токены траектории — включая локально неверные шаги, — потому что сигнал награды один и размазывается по всей цепочке.

  4. Сигнал получается шумным и бедным — «учёба через соломинку».

  5. Карпатый формулирует это спокойно: RL не тупик и местами работает, но крайне неэффективен по сигналу — одна награда в конце длинной цепочки даёт бедный обучающий сигнал.

  6. Он отмечает, что человеческое обучение устроено иначе — с рефлексией и пересмотром, а не только через разреженную награду в конце. Поэтому, по его публичной оценке, одним RL до интеллекта человеческого уровня не дотянуть: нужно ещё несколько алгоритмических прорывов, которых пока нет.

  7. Отсюда — сдержанность в прогнозах про AGI, а не пессимизм.

Чего агенту не хватает до сотрудника

Непрерывное обучение

Агент входит в каждую сессию с чистого листа. Человек-стажёр за месяц вырастает; опыт агента сам по себе между задачами не накапливается.

Надёжная работа с компьютером

Уверенно действовать в реальных интерфейсах, а не в идеальной песочнице, агенты пока не умеют стабильно.

Когнитивная стабильность

На длинной многошаговой задаче модель теряет нить и накапливает ошибку. Чем длиннее цепочка, тем заметнее.

Десятилетие, а не год

Почему именно код, и что это объясняет

  1. Исходное определение AGI, с которого стартовал OpenAI, — система, выполняющая любую экономически ценную задачу на уровне человека или лучше. А по наблюдению Карпатого, основной экономический выхлоп LLM через API сегодня — это одна узкая вещь: кодинг.

  2. Не консалтинг, не бухгалтерия, не юриспруденция. Почему?

  3. Карпатый называет код «идеальной первой задачей», и главный различитель здесь — верифицируемость: код запускается или нет, и это объективная истина, которой у эссе или слайдов нет.

  4. Рядом — структурность и однозначность синтаксиса и готовая инфраструктура вокруг (редакторы, версии, diff).

Код против «живой» работы

Свойство задачиКодСлайды, эссе, «живая» работа
Короткомашинный текст, где истинность проверяется запускомчеловеческий артефакт, где «хорошо» оценивают экспертно
Проверяемостьзапускается или нет — объективная истинатолько экспертная оценка, объективного теста нет
Структурностьстрогий синтаксис, однозначностьсвободная форма, многозначность
Инфраструктура вокругредакторы, версии, diffнет аналога diff, нет готового тулинга проверки

Для руководителей

Проверить ИИ на своей задаче, а не на демо

Если между «впечатляет» и «работает как сотрудник» — пропасть, честный способ оценить ИИ один: поставить его на реальный рабочий процесс и измерить. Внедрение короткими итерациями делает именно это — короткая итерация на реальном процессе, на выходе измеримая оценка применимости, а не демо.

  • Короткая итерация на реальном процессе, не на витрине
  • На выходе — измеримый результат и трезвая оценка применимости
  • Если задача типовая и закрывается готовым инструментом — спринт не нужен, и мы скажем об этом прямо
Как устроено внедрение короткими итерациями

Что теперь надо уметь

  1. Карпатый называет его jagged, «зубчатым». Где-то модель сверхчеловек, в шаге рядом — беспомощна, и граница неочевидна.

  2. На рельсах обучающих данных она сильна; в шаге от них — обрыв.

  3. Показателен его открытый учебный проект nanochat — сборка LLM полного цикла, около восьми тысяч строк за месяц с небольшим.

  4. Агенты почти не помогали: такого кода нет в интернете, и они тянули решение к типовым шаблонам из обучающих данных, возвращая обратно ровно тот стандартный механизм, который автор сознательно выкинул.

  5. На типовом — сильнее тебя; на уникальном — мешает.

  6. Отсюда первый навык новой эпохи: чувствовать, где рельсы, а где обрыв.

  7. Где агент сильнее тебя, а где подведёт.

  8. Карпатый описывает, как сам держит три режима и осознанно переключается между ними.

Три режима работы с агентом

  1. 01

    Автодополнение

    Человек — архитектор, агент дописывает строки. Контроль максимальный.

  2. 02

    Полная агентность

    На побочных, типовых проектах агенту отдаётся почти всё.

  3. 03

    Руль не отпускать

    На важном и уникальном человек ведёт сам, агент — на коротком поводке. Искусство не в «всегда максимум автономии», а в выборе режима под задачу.

Подберем материалы под вашу задачу

Три эпохи софта

ЭпохаЧем «программируешь»Что это меняет
Короткоот строк кода к датасетам, затем к естественному языкурычаг смещается с механики на постановку и контекст
Software 1.0пишешь код строчкамиклассическая инженерия
Software 2.0собираешь датасеты, обучаешь сетьповедение задаётся данными, а не правилами
Software 3.0формулируешь задачу на естественном языкепромпт — это код, контекст — рычаг, понимание задачи решает

Понимание против исполнения

В парадигме 3.0 происходит сдвиг, который

Карпатый описывает на себе: был момент, когда соотношение «сам пишу / делегирую» перевернулось — раньше большую часть кода он набирал руками, теперь большую часть отдаёт агенту. И вместе с облегчением приходит главный вопрос эпохи: если машина забрала механику — что остаётся человеку? Ответ, который он формулирует и который держит весь этот текст: машина забирает механику, человеку остаётся понимание.

Мышление как перемалывание — перебрать варианты, написать код, составить план — теперь делает агент, и часто лучше. А понимание — знать, что и зачем строишь, держать картину целиком, отличать хорошее от правдоподобного, направлять — не делегируется.

Карпатый честно называет себя бутылочным горлышком: кто-то должен понимать, куда двигаться, и это место не занять агентом.

Что забрала машина → что осталось человеку

Исполнение (делегируется)

  • набрать код, перебрать варианты, составить черновой план
  • переписать в нужном формате
  • найти типовое решение, которого много в открытом виде

Понимание (не делегируется)

  • решить, что вообще строить и зачем
  • держать систему целиком в голове, отличить хорошее решение от правдоподобного
  • направить агента и поймать, где он съехал с рельсов

Два навыка под одним словом

  1. Это напрямую переопределяет, что такое «навык работы с ИИ».

  2. Под «промпт-инжинирингом» прячутся две разные вещи, и их стоит развести: узкие заклинания вроде «думай пошагово» — расходный навык, модели умнеют и прощают кривые запросы; а умение разложить задачу, понять, что куда отдать, что проверить и как состыковать, — это direction, завязанный на понимание области.

  3. Универсального ИИ-приёма, который заменяет понимание, нет: расходные промпт-трюки обесцениваются с каждым поколением моделей.

  4. Понимание же рождается из экспертизы, опыта и насмотренности — поэтому образование не теряет смысла, а приобретает.

  5. Карпатого — не бунт машин, а постепенная, незаметная потеря людьми контроля и понимания: сползание человечества в роль пассажира собственной цивилизации.

  6. Его образ будущего ближе к «костюму

  7. Железного человека» — инструменту, усиливающему человека, чем к автономному роботу вместо него.

  8. Отсюда и его ставка на образование нового типа; характерная деталь — по интервью No Priors он говорит, что всё чаще объясняет вещи не людям, а агентам: хорошо объяснил агенту один раз, дальше агент объяснит это любому человеку под его уровень и не устанет повторять.

Какой навык растёт в цене

Защищённый — растёт в цене

  • разложить задачу, понять, что куда отдать, что проверить, как состыковать
  • direction, завязанный на понимание предметной области
  • не имитируется моделью — человек с агентами получает заметно больший выход, чем без них

Расходный — обесценивается

  • узкие заклинания вроде «думай пошагово»
  • модели умнеют и прощают кривые запросы
  • ценность таких приёмов падает с каждым поколением

Куда это движется: цифра → интерфейс → атомы

Порядок задан физикой, не хайпом

Фаза 1 — Цифра

Чистая цифратекст, код, данные; биты ничего не весят

Фаза 2 — Интерфейс

Стык цифры и физикисенсоры, актуаторы; масса компаний уже здесь

Фаза 3 — Атомы

Железо и роботыатомы в миллион раз тяжелее битов — отстанут сильнее всего
Сначала переделывается то, что не имеет массы; стык цифрового и физического — следом; атомы — последними и медленнее всего.

Человека отодвинули, а не убрали

  1. Отрезвляющая аналогия, которую он приводит, — беспилотные автомобили.

  2. Их доводят десятилетиями; и даже там, где машины уже ездят без водителя, человек часто не исчезает, а уходит в удалённый контур поддержки.

  3. Это и есть честная картина «автономности»: не исчезновение человека, а изменение его места в контуре.

  4. Его собственные карьерные шаги — ближе к разработке моделей, чем к обещаниям про «AGI через год» — согласуются с этой позицией.

  5. Трезвость здесь — это видеть реальность без сказок под раунды: если впереди десятилетие тяжёлой инженерии, логично идти отрабатывать его руками.

Две пары, которые индустрия путает

  1. Если свести всё к одному, индустрия систематически путает две пары понятий — и обе ошибки одной формы: лёгкое и эффектное принимают за трудное и реальное.

  2. Из этого вырастают три практических вывода.

  3. Специалист будущего — не «я умею в ИИ», а «я глубоко понимаю область и поэтому умею направить в ней ИИ».

  4. Для руководителя вопрос найма переформулируется: вы нанимаете тех, кто понимает, что строит, — или тех, кто красиво жмёт кнопки?

  5. Здесь же лежит проблема «чистого листа» из начала текста: агент не накапливает опыт между сессиями сам — носителем накапливаемого контекста остаётся команда и переносимая корпоративная память (например, Sloy).

  6. Закладывайтесь на десятилетие, а не на год; не верьте громким срокам и не привязывайтесь к конкретному инструменту.

  7. Это TTU-мышление — мерить время до реального использования, а не до красивой демонстрации.

  8. Переносимый контекст (AGENTS.md, skills, MCP — см. AI-принципы) здесь не только удобство, а страховка от vendor lock-in: систему можно забрать себе.

  9. Как это превращается в короткие проверяемые итерации, описано в подходе к внедрению ИИ.

  10. Если у тезиса нет механизма, цифры или проверки — это нарратив, а не инженерия.

Что с этим делать

Куда дальше в этом цикле

  1. Как вообще дать модели ваши знания — обзор всех способов: лендскейп «как дать LLM знания».

  2. Когда оправдано менять веса модели под себя: дообучение моделей — короткий гайд.

  3. Откуда брать цифры по стоимости моделей: сравнение LLM 2026 — выбор по процессу и бюджету; калькулятор контуров под ваши вводные — на хабе внедрения ИИ. И самое человеческое в этой позиции: за трезвостью стоит забота — сделать так, чтобы люди остались теми, кто понимает и направляет, а не пассажирами.

  4. Это не пессимизм, а трезвая оценка: закладываться на десятилетие тяжёлой инженерии и держать человека тем, кто понимает.

Источники

Дата проверки: 2026-06-30

Обсудить статью: Линза Карпатого: понимание против…

Отправить через: