Промокшие улицы Лондона, февральский холод пронизывает пальто на анти-ИИ-митинге — мятая листовка от Pause AI бросается в глаза, высмеивая грандиозные планы индустрии.
Эта листовка. Шаг 1: Вырастить цифровой сверхразум. Шаг 2: ? Шаг 3: ?
Гномы из «Южного Парка» сделали это лучше в 98-м, воровали нижнее белье с мечтами о прибыли без плана. Теперь очередь за ИИ — компании вроде OpenAI и Anthropic штампуют модели, раздувают трансформационное будущее, но кто же заполнит этот зияющий Шаг 2?
Pause AI требует паузы, регулирования, чтобы разобраться в этом бардаке. Сторонники? Они несутся к спасению, игнорируя пустоту. Главный научный сотрудник OpenAI Якуб Пачоцки называет это «экономически трансформационной технологией» — приятные слова, расплывчатая карта.
Почему второй шаг ИИ напоминает питч-дек гномов
Отбросим PR. Два исследования проливают свет. Anthropic предполагает, что LLM сильнее всего затронут менеджеров, архитекторов, медийщиков — садовники пока в безопасности. Предположения, правда, привязанные к лабораторным задачам, а не к офисному хаосу.
Mercor, компания, занимающаяся наймом с помощью ИИ, протестировала топовых агентов от OpenAI, Anthropic, Google DeepMind на 480 реальных должностях банкиров, консультантов, юристов. Результат? Эпический провал по всем фронтам.
Каждый протестированный агент не смог выполнить большую часть своих обязанностей.
Это цитата — жесткая, без прикрас. Откуда такая пропасть? Те, кто заявляет, имеют свои интересы. Anthropic предсказывает потрясения, чтобы продать безопасность. Хайп строится на скорости кодирующих инструментов, но стратегия? Оценка? LLM здесь терпят неудачу.
Реальный мир все усложняет — люди, рабочие процессы сопротивляются. Разрушить их ради ИИ? Это требует времени, смелости, которой не хватает бизнесу.
Вакуум заполняется дикими заявлениями. Один пост встряхивает рынки. Никакие доказательства нас не держат.
Вот уникальный взгляд: это отражает ситуацию доткомов 1999 года, когда накопились оптоволокно и серверы (Шаг 1), прибыль испарилась (нет Шага 3), а Шаг 2 — реальная жизнеспособность электронной коммерции — потребовал жестокого краха, чтобы выявиться. ИИ рискует пережить такую же чистку; без доказательства ROI в реальных предприятиях это будет пузырь 2.0.
Смогут ли ИИ-агенты когда-нибудь освоить рабочие задачи?
Вряд ли скоро. Исследования кричат о провале на не-кодирующих должностях. Точность банковских операций? Юридическая тонкость? Консультанты преуспевают, улавливая подтекст — слепое пятно ИИ.
Разработчики моделей хранят данные, развертывают их как «черный ящик». Нужна прозрачность, реальные бенчмарки. Бизнес координирует работу с исследователями, иначе это бесконечные догадки.
Индустрия ставит все на трансформацию. Пока не факт. Следующее смелое заявление? Вспомните про нижнее белье.
Цинично? Двадцать лет в окопах Кремниевой долины учат: хайп финансирует раунды, реальность — могилы. Кто сегодня в плюсе? Активисты, печатающие листовки, возможно. Венчурные капиталисты? До тех пор, пока не укрепится Шаг 2.
Является ли регулирование ответом на Шаг 2 ИИ?
Pause AI говорит «да» — остановиться, пока не станет безопасно. Но правоприменение? Глобальный бардак. EU AI Act касается лишь мелочей; США? Лоббисты пируют.
Сторонники кричат об убийстве инноваций. Правда: регулирование заставляет прояснить Шаг 2, иначе мы будем вечно крутиться в хайпе.
Тест Mercor — не исключение. Цепочки агентов, файнтюнинг — все равно провал на крайних случаях. Рабочие процессы запутываются; ИИ внедряется, создавая еще больший беспорядок.
Историческая параллель бьет точно: крах телекоммуникаций после эпохи доткомов показал, что одна только инфраструктура без монетизации проваливается. ИИ-лаборатории наращивают параметры (Шаг 1), обещают золото AGI (Шаг 3). Шаг 2 требует корпоративных пилотных проектов, доказывающих 10-кратный рост — редкое зрелище.
Прогнозы? 2026 год увидит встряску. Половина этих агентов будет списана; выжившие займут ниши в рутинных задачах. Широкая трансформация? Самое раннее 2030 год, если вообще произойдет. Бизнес копит деньги, ждет доказательств.
Экономика висит на обещаниях. Скептики, такие как Pause AI, указывают на проблемы. Умные деньги следят за оценками в стиле Mercor, а не за ключевыми докладами.
Та листовка? Пророческая. Заполните Шаг 2, или присоединяйтесь к гномам в аду мемов.
🧬 Связанные материалы
- Читать еще: Две утечки подряд от Anthropic дали конкурентам blueprint кода Claude
- Читать еще: Синтетические сирены: ИИ-подкастеры зарабатывают на отчаянии в знакомствах
Часто задаваемые вопросы
Что такое «упущенный второй шаг» ИИ?
Неясный путь от создания мощных моделей к реальной прибыли и трансформации — исследования показывают, что агенты терпят неудачу в реальных задачах.
Действительно ли ИИ-агенты проваливаются на рабочих местах?
Да, тест Mercor на 480 задачах с использованием топовых моделей, таких как OpenAI, показал, что большинство обязанностей не выполнено.
Исправит ли регулирование ИИ-хайп?
Оно может заставить искать доказательства вместо обещаний, но глобальное правоприменение значительно отстает.