Линза Карпатого: понимание против исполнения

Карпатый строит ИИ и одновременно публично его описывает: один из основателей-членов команды OpenAI, годы руководства ИИ и автопилотом в Tesla, автор учебных материалов, на которых выросло поколение инженеров (micrograd, nanoGPT).
По его публичным выступлениям видно нежелание раздувать ожидания: там, где индустрия обещает «AGI через год», он говорит «десятилетие».
Это не пересказ его интервью, а попытка вытащить из его публичной позиции один цельный фрейм и разложить его так, чтобы им можно было пользоваться при решениях.
Фрейм держится на трёх параллельных утверждениях: понимание бьёт исполнение, реальность бьёт таймлайны, инженерия бьёт нарратив.
Три раза одна и та же ошибка — лёгкое и эффектное принимают за трудное и реальное.
Всё ниже подано как публичная позиция Карпатого, а не как установленный факт о мире; биографические частности я намеренно опускаю.

Главное

Карпатый описывает ИИ не как «цифровое существо», а как «дух» (ghost): он собран из человеческих текстов и имитирует человека, но устроен иначе. На «духа» не действуют мотивация, давление, похвала — постановку цели и проверку человек держит на себе.
«Год агентов» он публично заменяет на «десятилетие»: между «впечатляет» и «работает как сотрудник» лежат три нерешённые задачи — непрерывное обучение, надёжная работа с интерфейсами, когнитивная стабильность на длинной цепочке.
Код — «идеальная первая задача» ИИ: машинный, структурный, проверяемый запуском. Это объясняет и силу в кодинге, и пробуксовку там, где истинность нельзя проверить.
Сквозная мысль: мышление можно отдать на аутсорс, понимание — нет. Машина забирает механику; человеку остаётся знать, что и зачем он строит.
Для бизнеса ценность смещается от навыка «жать кнопки» к пониманию предметной области и умению направить в ней ИИ. Фильтр для любого прогноза — «это инженерия или фандрейзинг?».

Не новая форма жизни, а «дух»

Индустрия любит аналогию ИИ с живым мозгом — «цифровое животное», «новый вид интеллекта».

Карпатый эту метафору отводит — и приводит механизм, почему она неверна.

Зебрёнок рождается и через минуты бежит: инстинкты вшиты эволюцией, обучение поверх минимально.

Большая языковая модель устроена наоборот.

Она берёт гигантский корпус человеческого текста и учится его имитировать.

Это не существо со своей биологией, а, по его формулировке, эфирный призрак — «дух», который мимикрирует под человека, потому что собран из человеческих следов, но внутри устроен иначе.

Вывод здесь не философский, а рабочий.

Если держать правильную модель того, чем ИИ является, работаешь с ним эффективнее.

На «духа» бессмысленно кричать, давить срочностью, мотивировать, хвалить за старание — у него нет страха, азарта, желания понравиться, воли, инициативы, любопытства. Всё, что в человеке порождает инициативу и заботу «туда ли мы идём», человек обязан держать на себе и встраивать в процесс явно: проверку, остановку, сверку направления. ИИ — почти идеальное зеркало человеческого текста, и здесь же скрыт риск: мы склонны принимать собственное отражение за собеседника.

Карпатый описывает эту ловушку на себе — желание заслужить «одобрение» модели, когда ассистент будто «теплеет» на удачную идею.

Это показывает природу духа, а не его волю.

Почему «дух» не превращается в разум по щелчку

Здесь же лежит причина его осторожности по срокам.
Современные системы во многом дотягивают обучением с подкреплением (RL). У RL есть встроенная слабость: награда часто одна и приходит в конце длинной цепочки действий.
При положительном итоге апвейтятся все токены траектории — включая локально неверные шаги, — потому что сигнал награды один и размазывается по всей цепочке.
Сигнал получается шумным и бедным — «учёба через соломинку».
Карпатый формулирует это спокойно: RL не тупик и местами работает, но крайне неэффективен по сигналу — одна награда в конце длинной цепочки даёт бедный обучающий сигнал.
Он отмечает, что человеческое обучение устроено иначе — с рефлексией и пересмотром, а не только через разреженную награду в конце. Поэтому, по его публичной оценке, одним RL до интеллекта человеческого уровня не дотянуть: нужно ещё несколько алгоритмических прорывов, которых пока нет.
Отсюда — сдержанность в прогнозах про AGI, а не пессимизм.

Чего агенту не хватает до сотрудника

Непрерывное обучение

Агент входит в каждую сессию с чистого листа. Человек-стажёр за месяц вырастает; опыт агента сам по себе между задачами не накапливается.

Надёжная работа с компьютером

Уверенно действовать в реальных интерфейсах, а не в идеальной песочнице, агенты пока не умеют стабильно.

Когнитивная стабильность

На длинной многошаговой задаче модель теряет нить и накапливает ошибку. Чем длиннее цепочка, тем заметнее.

Десятилетие, а не год

В ответ на публичный тезис про «год агентов» Карпатый говорит о десятилетии. Он сам пользуется агентами ежедневно и хвалит их, но между «впечатляет» и «работает как самостоятельный сотрудник» лежит пропасть из трёх нерешённых задач.

3 задачи непрерывное обучение, надёжная работа с интерфейсами, когнитивная стабильность — то, что отделяет демо от сотрудника

Источник прогноза — не настроение, а откалиброванная интуиция: годы внутри ИИ, в которые уверенные прогнозы расходились с реальностью.
Он скорее оптимист, просто многое в ленте — это фандрейзинг, а не инженерия; различать эти два режима речи отдельный навык.
Полезный фильтр для ЛПР: громкий прогноз про «AGI через год» — это оценка того, что реально работает, или элемент истории под раунд?

Почему именно код, и что это объясняет

Исходное определение AGI, с которого стартовал OpenAI, — система, выполняющая любую экономически ценную задачу на уровне человека или лучше. А по наблюдению Карпатого, основной экономический выхлоп LLM через API сегодня — это одна узкая вещь: кодинг.
Не консалтинг, не бухгалтерия, не юриспруденция. Почему?
Карпатый называет код «идеальной первой задачей», и главный различитель здесь — верифицируемость: код запускается или нет, и это объективная истина, которой у эссе или слайдов нет.
Рядом — структурность и однозначность синтаксиса и готовая инфраструктура вокруг (редакторы, версии, diff).

Код против «живой» работы

Свойство задачи	Код	Слайды, эссе, «живая» работа
Коротко	машинный текст, где истинность проверяется запуском	человеческий артефакт, где «хорошо» оценивают экспертно
Проверяемость	запускается или нет — объективная истина	только экспертная оценка, объективного теста нет
Структурность	строгий синтаксис, однозначность	свободная форма, многозначность
Инфраструктура вокруг	редакторы, версии, diff	нет аналога diff, нет готового тулинга проверки

Для руководителей

Проверить ИИ на своей задаче, а не на демо

Если между «впечатляет» и «работает как сотрудник» — пропасть, честный способ оценить ИИ один: поставить его на реальный рабочий процесс и измерить. Внедрение короткими итерациями делает именно это — короткая итерация на реальном процессе, на выходе измеримая оценка применимости, а не демо.

Короткая итерация на реальном процессе, не на витрине
На выходе — измеримый результат и трезвая оценка применимости
Если задача типовая и закрывается готовым инструментом — спринт не нужен, и мы скажем об этом прямо

Как устроено внедрение короткими итерациями

Что теперь надо уметь

Карпатый называет его jagged, «зубчатым». Где-то модель сверхчеловек, в шаге рядом — беспомощна, и граница неочевидна.
На рельсах обучающих данных она сильна; в шаге от них — обрыв.
Показателен его открытый учебный проект nanochat — сборка LLM полного цикла, около восьми тысяч строк за месяц с небольшим.
Агенты почти не помогали: такого кода нет в интернете, и они тянули решение к типовым шаблонам из обучающих данных, возвращая обратно ровно тот стандартный механизм, который автор сознательно выкинул.
На типовом — сильнее тебя; на уникальном — мешает.
Отсюда первый навык новой эпохи: чувствовать, где рельсы, а где обрыв.
Где агент сильнее тебя, а где подведёт.
Карпатый описывает, как сам держит три режима и осознанно переключается между ними.

Три режима работы с агентом

01
Автодополнение
Человек — архитектор, агент дописывает строки. Контроль максимальный.
02
Полная агентность
На побочных, типовых проектах агенту отдаётся почти всё.
03
Руль не отпускать
На важном и уникальном человек ведёт сам, агент — на коротком поводке. Искусство не в «всегда максимум автономии», а в выборе режима под задачу.

Подберем материалы под вашу задачу

Почта clients@kt.team Telegram @kt_team_blog

Три эпохи софта

Эпоха	Чем «программируешь»	Что это меняет
Коротко	от строк кода к датасетам, затем к естественному языку	рычаг смещается с механики на постановку и контекст
Software 1.0	пишешь код строчками	классическая инженерия
Software 2.0	собираешь датасеты, обучаешь сеть	поведение задаётся данными, а не правилами
Software 3.0	формулируешь задачу на естественном языке	промпт — это код, контекст — рычаг, понимание задачи решает

Понимание против исполнения

В парадигме 3.0 происходит сдвиг, который

Карпатый описывает на себе: был момент, когда соотношение «сам пишу / делегирую» перевернулось — раньше большую часть кода он набирал руками, теперь большую часть отдаёт агенту. И вместе с облегчением приходит главный вопрос эпохи: если машина забрала механику — что остаётся человеку? Ответ, который он формулирует и который держит весь этот текст: машина забирает механику, человеку остаётся понимание.

Мышление как перемалывание — перебрать варианты, написать код, составить план — теперь делает агент, и часто лучше. А понимание — знать, что и зачем строишь, держать картину целиком, отличать хорошее от правдоподобного, направлять — не делегируется.

Карпатый честно называет себя бутылочным горлышком: кто-то должен понимать, куда двигаться, и это место не занять агентом.

Что забрала машина → что осталось человеку

Исполнение (делегируется)

набрать код, перебрать варианты, составить черновой план
переписать в нужном формате
найти типовое решение, которого много в открытом виде

Понимание (не делегируется)

решить, что вообще строить и зачем
держать систему целиком в голове, отличить хорошее решение от правдоподобного
направить агента и поймать, где он съехал с рельсов

Два навыка под одним словом

Это напрямую переопределяет, что такое «навык работы с ИИ».
Под «промпт-инжинирингом» прячутся две разные вещи, и их стоит развести: узкие заклинания вроде «думай пошагово» — расходный навык, модели умнеют и прощают кривые запросы; а умение разложить задачу, понять, что куда отдать, что проверить и как состыковать, — это direction, завязанный на понимание области.
Универсального ИИ-приёма, который заменяет понимание, нет: расходные промпт-трюки обесцениваются с каждым поколением моделей.
Понимание же рождается из экспертизы, опыта и насмотренности — поэтому образование не теряет смысла, а приобретает.
Карпатого — не бунт машин, а постепенная, незаметная потеря людьми контроля и понимания: сползание человечества в роль пассажира собственной цивилизации.
Его образ будущего ближе к «костюму
Железного человека» — инструменту, усиливающему человека, чем к автономному роботу вместо него.
Отсюда и его ставка на образование нового типа; характерная деталь — по интервью No Priors он говорит, что всё чаще объясняет вещи не людям, а агентам: хорошо объяснил агенту один раз, дальше агент объяснит это любому человеку под его уровень и не устанет повторять.

Какой навык растёт в цене

Защищённый — растёт в цене

разложить задачу, понять, что куда отдать, что проверить, как состыковать
direction, завязанный на понимание предметной области
не имитируется моделью — человек с агентами получает заметно больший выход, чем без них

Расходный — обесценивается

узкие заклинания вроде «думай пошагово»
модели умнеют и прощают кривые запросы
ценность таких приёмов падает с каждым поколением

Куда это движется: цифра → интерфейс → атомы

Порядок задан физикой, не хайпом

Фаза 1 — Цифра

Чистая цифратекст, код, данные; биты ничего не весят

Фаза 2 — Интерфейс

Стык цифры и физикисенсоры, актуаторы; масса компаний уже здесь

Фаза 3 — Атомы

Железо и роботыатомы в миллион раз тяжелее битов — отстанут сильнее всего

Сначала переделывается то, что не имеет массы; стык цифрового и физического — следом; атомы — последними и медленнее всего.

Человека отодвинули, а не убрали

Отрезвляющая аналогия, которую он приводит, — беспилотные автомобили.
Их доводят десятилетиями; и даже там, где машины уже ездят без водителя, человек часто не исчезает, а уходит в удалённый контур поддержки.
Это и есть честная картина «автономности»: не исчезновение человека, а изменение его места в контуре.
Его собственные карьерные шаги — ближе к разработке моделей, чем к обещаниям про «AGI через год» — согласуются с этой позицией.
Трезвость здесь — это видеть реальность без сказок под раунды: если впереди десятилетие тяжёлой инженерии, логично идти отрабатывать его руками.

Две пары, которые индустрия путает

Если свести всё к одному, индустрия систематически путает две пары понятий — и обе ошибки одной формы: лёгкое и эффектное принимают за трудное и реальное.
Из этого вырастают три практических вывода.
Специалист будущего — не «я умею в ИИ», а «я глубоко понимаю область и поэтому умею направить в ней ИИ».
Для руководителя вопрос найма переформулируется: вы нанимаете тех, кто понимает, что строит, — или тех, кто красиво жмёт кнопки?
Здесь же лежит проблема «чистого листа» из начала текста: агент не накапливает опыт между сессиями сам — носителем накапливаемого контекста остаётся команда и переносимая корпоративная память (например, Sloy).
Закладывайтесь на десятилетие, а не на год; не верьте громким срокам и не привязывайтесь к конкретному инструменту.
Это TTU-мышление — мерить время до реального использования, а не до красивой демонстрации.
Переносимый контекст (AGENTS.md, skills, MCP — см. AI-принципы) здесь не только удобство, а страховка от vendor lock-in: систему можно забрать себе.
Как это превращается в короткие проверяемые итерации, описано в подходе к внедрению ИИ.
Если у тезиса нет механизма, цифры или проверки — это нарратив, а не инженерия.

Что с этим делать

Стройте карьеру и команду на понимании предметной области, а не на навыке «жать кнопки»: последний обесценивается с каждым поколением моделей.
Прогоняйте каждый громкий прогноз и каждый продукт с «волшебной таблеткой» через фильтр «инженерия или фандрейзинг?».
Закладывайтесь на «десятилетие, а не год»: не привязывайтесь к одному инструменту, держите контекст переносимым.
Оставляйте человека в контуре осознанно: постановка цели, проверка шагов, решение «продолжать или остановиться» — на человеке.
Главный мета-навык эпохи — учиться учиться: на нём держится способность понимать, а не только исполнять.

Куда дальше в этом цикле

Как вообще дать модели ваши знания — обзор всех способов: лендскейп «как дать LLM знания».
Когда оправдано менять веса модели под себя: дообучение моделей — короткий гайд.
Откуда брать цифры по стоимости моделей: сравнение LLM 2026 — выбор по процессу и бюджету; калькулятор контуров под ваши вводные — на хабе внедрения ИИ. И самое человеческое в этой позиции: за трезвостью стоит забота — сделать так, чтобы люди остались теми, кто понимает и направляет, а не пассажирами.
Это не пессимизм, а трезвая оценка: закладываться на десятилетие тяжёлой инженерии и держать человека тем, кто понимает.

Источники

Дата проверки: 2026-06-30