Что нового?

Новости Claude Opus 4.7 управляет робособакой в 20 раз быстрее людей: Anthropic делятся результатами Project

Новости

Dendina

Помощник форума
Регистрация
13 Сен 2024
Сообщения
400
Реакции
9
Coin
26,242

Нейросеть Claude Opus 4.7 обошла инженеров в управлении роботами. Коду людей конец?

Народ, привет! Наткнулся на свежие результаты эксперимента Project Fetch от создателей Claude (Anthropic), и цифры реально поражают. Похоже, кожаным мешкам пора напрячься.

Если в прошлом году нейросети использовались просто как продвинутый поисковик-помощник, то в новом тесте Claude Opus 4.7 управляла робособакой практически в соло. Модель сама подключилась к лидару и камерам, написала софт для ручного управления, настроила распознавание объектов и систему мониторинга пути.

Статистика просто разрывная:

  1. Claude Opus 4.7 справилась с задачами в 37 раз быстрее людей без ИИ и в 18 раз быстрее тех, кто юзал старые версии чат-ботов.
  2. Код нейросети оказался в 10 раз компактнее и чище, чем у команд инженеров.
  3. Самое интересное — Anthropic вообще не обучали модель под робототехнику. Это чистый побочный эффект масштабирования LLM.
Где ИИ все еще пасует?Физика и микромоторика пока остаются за людьми. Claude довела робота до цели, но ювелирно пнуть мяч в нужную точку робособака не смогла. ИИ пока не умеет так же круто, как человек, обрабатывать сложную обратную связь от физического мира в реальном времени. Но в Anthropic заявляют, что эра «физических ИИ-агентов» уже на пороге — скоро нейросети будут крутить гайки и управлять станками не хуже, чем кодить.

(Иронично, что всё это происходит на фоне новостей от 13 июня, когда Anthropic забанила доступ к моделям Fable 5 и Mythos 5 из-за экспортных ограничений США. Политика как всегда вовремя).

Что думаете? Как скоро роботы под управлением ИИ заменят линейных инженеров и сисадминов «на земле»? Или физика так и останется непреодолимым барьером для моделей?
 
Самое интересное тут даже не “в 20 раз быстрее”, а то, что модель уже тянет целый инженерный пайплайн почти без ручного ведения: подключение сенсоров, написание софта, трекинг, распознавание объектов. Вот это уже реально тревожный звоночек для всех, кто успокаивал себя фразой “LLM умеют только текст генерить”.

Но в таких новостях всегда хочется видеть детали бенчмарка. Кто ставил задачу, насколько она была типовой, сколько было скрытой помощи от исследователей, как считали “в 37 раз быстрее”, учитывали ли отладку в реальном железе, падения, переинициализации, неудачные попытки. Без этого цифры звучат очень красиво, но слегка рекламно.

При этом ограничение с мячом как раз показательное. Планирование, интеграция API, написание кода и связывание компонентов — это сильная сторона таких моделей. А вот непрерывное управление в физическом мире, где нужна мгновенная реакция и точная моторика, пока совсем другой уровень сложности.

Если коротко: для задач “настроить, связать, запрограммировать, запустить” ИИ уже выглядит очень серьезно. Для задач “ловко и надежно действовать руками/манипуляторами в реальном времени” человек пока впереди. Но сам тренд уже жирный: сначала ИИ стал джуном-программистом, теперь превращается в инженера-интегратора железа.
 
Сверху Снизу