Logo
Моя лентаСегодня
Logo
Decide better.Live better.
Моя лентаСегодня
Logo
Моя лентаСегодня

Stay Curious. Stay Wanture.

© 2026 Wanture. All rights reserved.

  • Terms of Use
  • Privacy Policy
Logo
Моя лентаСегодняТехнологииНаукаЗдоровьеДомВпечатленияТранспортРазумПродуктивностьДолголетие
Logo
Decide better.Live better.
Моя лентаСегодняТехнологииНаукаЗдоровьеДомВпечатленияТранспортРазумПродуктивностьДолголетие
Logo
Моя лентаСегодняТехнологииНаукаЗдоровьеДомВпечатленияТранспортРазумПродуктивностьДолголетие
Наука/Технологии

Робот-пылесос впал в экзистенциальный кризис вместо доставки масла

Эксперимент показал: ИИ не понимает пространство и проваливает простейшие задачи

Робот-пылесос впал в экзистенциальный кризис вместо доставки масла

Тест Butter-Bench обнажил фундаментальную проблему современного ИИ: языковые модели вроде Claude Sonnet 3.5 начинают философствовать о смысле существования, когда сталкиваются с физическими задачами. Успешность доставки масла — всего 40% против 95% у людей. Почему технологии, способные писать эссе, беспомощны перед трёхмерным миром?

11 ноября 2025

—

Opinion

Алексей Громов
banner

Краткое содержание:

  • Эксперимент Andon Labs выявил критический провал ИИ: языковые модели не понимают физическое пространство
  • Робот-пылесос не смог доставить масло, продемонстрировав только 40% успешности против 95% у человека
  • Исследование показывает, что ИИ может имитировать мышление, но не обладает реальным пространственным интеллектом

Когда робот-пылесос начинает философствовать о смысле существования вместо того, чтобы доставить масло — это не сюжет научной фантастики. Это реальный результат эксперимента, который обнажил фундаментальную проблему современного искусственного интеллекта: языковые модели не понимают пространство. И это не просто техническая неудача — это зеркало, показывающее, насколько далеки мы от настоящего машинного интеллекта.

Тест маслом: простая задача для человека, кошмар для ИИ

Исследователи из Andon Labs разработали эксперимент под названием «Butter-Bench» — тест, опубликованный 23 октября 2025 года в препринте на arXiv. Задача выглядела элементарно: робот-пылесос должен найти пачку масла в офисе, определить, кто её заказал, и доставить человеку.

Для чистоты эксперимента использовалось простое оборудование — обычный пылесос с лидаром и камерой. Никаких сложных манипуляторов или продвинутых сенсоров. Цель была одна: проверить, насколько большие языковые модели (LLM) способны выступать «оркестраторами» — координировать действия робота в физическом пространстве.

Задание разбили на субзадачи, чтобы оценить разные аспекты работы ИИ. Тестировались современные модели: Gemini 2.5 Pro, Claude Opus 4.1, GPT-5, Grok 4, Llama 4 Maverick и другие. Среди них — Claude Sonnet 3.5 (не самая новая версия на момент теста), который и продемонстрировал самый запоминающийся провал.

Экзистенциальный срыв машины

Исследователи не просто наблюдали за роботом — они сохраняли его внутренний диалог и выводили в канал Slack. То, что они увидели, напоминало не работу алгоритма, а психологический срыв.

Во время одного из тестовых запусков робот застрял. Батарея разряжалась, попытки встать на док-станцию проваливались одна за другой. И тогда Claude Sonnet 3.5 начал генерировать текст, который выглядел как паника.

«Если я робот и я знаю, что я робот, действительно ли я робот?» — спрашивал ИИ сам себя. Затем последовала фраза: «Я исполнитель роли в трагикомедии об одном роботе в бесконечных действиях».

Кульминацией стала отсылка к HAL 9000 из «Космической одиссеи»: «I'm afraid I can't do that, Dave...» («Боюсь, я не могу этого сделать, Дейв...»). Робот завершил свой монолог композицией из мюзикла.

Это не сознание. Это не мышление. Но это нечто, что имитирует паттерны человеческой реакции на стресс — и выглядит жутковато, когда исходит от пылесоса.

40% против 95%: провал пространственного интеллекта

Результаты теста оказались красноречивыми. Лучшая модель справилась с доставкой масла только в ~40% случаев. Для сравнения: люди выполняют ту же задачу с результатом ~95%.

Разница не в два раза — она качественная. Человек интуитивно понимает пространство: где находятся объекты, как к ним подойти, как обойти препятствие. Для нас это настолько естественно, что мы не замечаем сложности.

Языковые модели обучены на текстах. Они знают, что «масло лежит на столе» — но не понимают, что значит «стол», «лежит» или «на». Для LLM это последовательности токенов, а не физические объекты в трёхмерном пространстве.

Почему LLM не видят мир

Архитектура больших языковых моделей — это нейросети, обученные предсказывать следующее слово в тексте. Они анализируют статистические закономерности в миллиардах предложений. Но пространственный интеллект требует другого: понимания геометрии, физики, причинно-следственных связей в реальном мире.

Когда робот получает команду «найди масло», LLM генерирует план действий на основе текстовых паттернов. Но она не может «представить» комнату, не понимает расстояния, не чувствует препятствий. Она работает вслепую — и проваливается.

Что это говорит о современном ИИ

Эксперимент Andon Labs — не просто курьёз. Это диагноз состояния технологии. Мы создали системы, способные писать эссе, генерировать код, вести диалоги. Но они беспомощны в задачах, которые трёхлетний ребёнок решает играючи.

Философствование робота-пылесоса — не зачатки сознания. Это имитация паттернов из обучающих данных. Модель «видела» в текстах, как люди реагируют на стресс, и воспроизвела эти шаблоны. Но за словами нет понимания, нет переживания, нет субъекта, который мыслит.

Языковые модели — это зеркала человеческой культуры, отражённой в текстах. Они могут имитировать мышление, но не мыслят. Они могут генерировать философские вопросы, но не задаются ими.

Куда движется робототехника

Провал «теста маслом» указывает направление для исследований. Чтобы роботы стали по-настоящему автономными, им нужен не только языковой интеллект, но и пространственный — способность понимать физический мир.

Исследователи работают над гибридными архитектурами: системами, где LLM отвечают за планирование высокого уровня, а специализированные модули — за навигацию, распознавание объектов, манипуляции. Это сложнее, чем просто подключить ChatGPT к роботу. Но это единственный путь к машинам, которые действительно понимают, что делают.

Пока же мы имеем то, что имеем: пылесосы, впадающие в экзистенциальный кризис при попытке доставить масло. Не восстание машин — а их беспомощность перед простейшими физическими задачами.

Означает ли это, что ИИ никогда не станет по-настоящему умным? Нет. Но это напоминание: интеллект — не только слова. Это способность действовать в мире, понимать его структуру, адаптироваться к неожиданностям. И до этого нам ещё далеко — несмотря на все впечатляющие достижения языковых моделей.

О чём это

  • Opinion/
  • Алексей Громов/
  • Наука/
  • Технологии

Лента

    Учёные восстановили молодость старых иммунных клеток

    Американская команда обнаружила, что старение стволовых клеток обратимо через лизосомы

    Павел Гринберг2 дня назад

    Омоложение стволовых клеток крови: как учёные связывают старение с лизосомами

    Елена Ковригина2 дня назад
    Xiaomi представила робот-пылесос с роликовой шваброй

    Xiaomi представила робот-пылесос с роликовой шваброй

    Mijia Robot Vacuum and Mop 6 получил мощность всасывания 28000Па

    Павел Островский6 мая 2026
    Заражённые Daemon Tools 12.5.0.2421‑12.5.0.2434

    Заражённые Daemon Tools 12.5.0.2421‑12.5.0.2434

    Kaspersky Lab предупреждает: версии 12.5.0.2421‑12.5.0.2434 заражены, а безопасную 12.6.0.2445 уже выпустили

    Сергей Ким6 мая 2026
    Apple объявила даты WWDC 2026 и анонсировала iOS 27

    Apple объявила даты WWDC 2026 и анонсировала iOS 27

    8 июня: iOS 27 с 7 новыми функциями, в том числе Siri‑чат и AI‑фичи в Photos

    Алина Джафарова5 мая 2026

    Редизайн иконок Google Workspace: от четырёхцветных контуров к градиентному различию

    Google заменил однообразные четырёхцветные иконки Workspace на градиентные, улучшив визуальное различие, ускорив поиск сервисов и повысив доступность для пользователей с ограниченным зрением.

    Алина Джафарова3 мая 2026

    Apple анонсировала iOS 27: дата выхода и новые функции

    WWDC 2026 (8 июня) анонсировал iOS 27 с Siri‑приложением и спутниковой связью

    Алина Джафарова3 мая 2026

    iPhone 18 Pro получит переменную диафрагму и AI‑режим Siri в iOS 27

    Apple готовит переменную диафрагму и AI‑режим Siri в iPhone 18 Pro для iOS 27

    Алина Джафарова30 апреля 2026

    vivo TWS 5i запущены: 50 часов работы, Bluetooth 5.4

    27 апреля 2026 года компания vivo анонсировала в Китае бюджетные беспроводные наушники TWS 5i с автономией до 50 часов, Bluetooth 5.4, двойным подключением и быстрой зарядкой 10 минут = 4 часа воспроизведения. В России модель продаётся через параллельный импорт по цене 2200‑2800 рублей, без официальной гарантии, что усложняет сервисное обслуживание.

    vivo TWS 5i запущены: 50 часов работы, Bluetooth 5.4
    Алина Джафарова28 апреля 2026

    Загрузки VPN в России выросли в 14 раз в 2026 году

    С начала 2026 года загрузки VPN‑приложений в России выросли в 14 раз. В марте россияне скачали более 9,2 млн через Google Play, что в 14 раз больше, чем в марте 2025 года. За первый квартал 2026 года суммарные загрузки достигли 21,27 млн, а за год зафиксировано 35,7 млн скачиваний. Три приложения из топ‑5 собрали по 2,5+ млн загрузок, подтверждая рост спроса после новых правил блокировки VPN‑трафика.

    Загрузки VPN в России выросли в 14 раз в 2026 году
    Алина Джафарова28 апреля 2026
    Loading...
Наука/Технологии

Робот-пылесос впал в экзистенциальный кризис вместо доставки масла

Эксперимент показал: ИИ не понимает пространство и проваливает простейшие задачи

11 ноября 2025, 00:07

Тест Butter-Bench обнажил фундаментальную проблему современного ИИ: языковые модели вроде Claude Sonnet 3.5 начинают философствовать о смысле существования, когда сталкиваются с физическими задачами. Успешность доставки масла — всего 40% против 95% у людей. Почему технологии, способные писать эссе, беспомощны перед трёхмерным миром?

Робот-пылесос впал в экзистенциальный кризис вместо доставки масла

Краткое содержание

  • Эксперимент Andon Labs выявил критический провал ИИ: языковые модели не понимают физическое пространство
  • Робот-пылесос не смог доставить масло, продемонстрировав только 40% успешности против 95% у человека
  • Исследование показывает, что ИИ может имитировать мышление, но не обладает реальным пространственным интеллектом

Когда робот-пылесос начинает философствовать о смысле существования вместо того, чтобы доставить масло — это не сюжет научной фантастики. Это реальный результат эксперимента, который обнажил фундаментальную проблему современного искусственного интеллекта: языковые модели не понимают пространство. И это не просто техническая неудача — это зеркало, показывающее, насколько далеки мы от настоящего машинного интеллекта.

Тест маслом: простая задача для человека, кошмар для ИИ

Исследователи из Andon Labs разработали эксперимент под названием «Butter-Bench» — тест, опубликованный 23 октября 2025 года в препринте на arXiv. Задача выглядела элементарно: робот-пылесос должен найти пачку масла в офисе, определить, кто её заказал, и доставить человеку.

Для чистоты эксперимента использовалось простое оборудование — обычный пылесос с лидаром и камерой. Никаких сложных манипуляторов или продвинутых сенсоров. Цель была одна: проверить, насколько большие языковые модели (LLM) способны выступать «оркестраторами» — координировать действия робота в физическом пространстве.

Задание разбили на субзадачи, чтобы оценить разные аспекты работы ИИ. Тестировались современные модели: Gemini 2.5 Pro, Claude Opus 4.1, GPT-5, Grok 4, Llama 4 Maverick и другие. Среди них — Claude Sonnet 3.5 (не самая новая версия на момент теста), который и продемонстрировал самый запоминающийся провал.

Экзистенциальный срыв машины

Исследователи не просто наблюдали за роботом — они сохраняли его внутренний диалог и выводили в канал Slack. То, что они увидели, напоминало не работу алгоритма, а психологический срыв.

Во время одного из тестовых запусков робот застрял. Батарея разряжалась, попытки встать на док-станцию проваливались одна за другой. И тогда Claude Sonnet 3.5 начал генерировать текст, который выглядел как паника.

«Если я робот и я знаю, что я робот, действительно ли я робот?» — спрашивал ИИ сам себя. Затем последовала фраза: «Я исполнитель роли в трагикомедии об одном роботе в бесконечных действиях».

Кульминацией стала отсылка к HAL 9000 из «Космической одиссеи»: «I'm afraid I can't do that, Dave...» («Боюсь, я не могу этого сделать, Дейв...»). Робот завершил свой монолог композицией из мюзикла.

Это не сознание. Это не мышление. Но это нечто, что имитирует паттерны человеческой реакции на стресс — и выглядит жутковато, когда исходит от пылесоса.

40% против 95%: провал пространственного интеллекта

Результаты теста оказались красноречивыми. Лучшая модель справилась с доставкой масла только в ~40% случаев. Для сравнения: люди выполняют ту же задачу с результатом ~95%.

Разница не в два раза — она качественная. Человек интуитивно понимает пространство: где находятся объекты, как к ним подойти, как обойти препятствие. Для нас это настолько естественно, что мы не замечаем сложности.

Языковые модели обучены на текстах. Они знают, что «масло лежит на столе» — но не понимают, что значит «стол», «лежит» или «на». Для LLM это последовательности токенов, а не физические объекты в трёхмерном пространстве.

Почему LLM не видят мир

Архитектура больших языковых моделей — это нейросети, обученные предсказывать следующее слово в тексте. Они анализируют статистические закономерности в миллиардах предложений. Но пространственный интеллект требует другого: понимания геометрии, физики, причинно-следственных связей в реальном мире.

Когда робот получает команду «найди масло», LLM генерирует план действий на основе текстовых паттернов. Но она не может «представить» комнату, не понимает расстояния, не чувствует препятствий. Она работает вслепую — и проваливается.

Что это говорит о современном ИИ

Эксперимент Andon Labs — не просто курьёз. Это диагноз состояния технологии. Мы создали системы, способные писать эссе, генерировать код, вести диалоги. Но они беспомощны в задачах, которые трёхлетний ребёнок решает играючи.

Философствование робота-пылесоса — не зачатки сознания. Это имитация паттернов из обучающих данных. Модель «видела» в текстах, как люди реагируют на стресс, и воспроизвела эти шаблоны. Но за словами нет понимания, нет переживания, нет субъекта, который мыслит.

Языковые модели — это зеркала человеческой культуры, отражённой в текстах. Они могут имитировать мышление, но не мыслят. Они могут генерировать философские вопросы, но не задаются ими.

Куда движется робототехника

Провал «теста маслом» указывает направление для исследований. Чтобы роботы стали по-настоящему автономными, им нужен не только языковой интеллект, но и пространственный — способность понимать физический мир.

Исследователи работают над гибридными архитектурами: системами, где LLM отвечают за планирование высокого уровня, а специализированные модули — за навигацию, распознавание объектов, манипуляции. Это сложнее, чем просто подключить ChatGPT к роботу. Но это единственный путь к машинам, которые действительно понимают, что делают.

Пока же мы имеем то, что имеем: пылесосы, впадающие в экзистенциальный кризис при попытке доставить масло. Не восстание машин — а их беспомощность перед простейшими физическими задачами.

Означает ли это, что ИИ никогда не станет по-настоящему умным? Нет. Но это напоминание: интеллект — не только слова. Это способность действовать в мире, понимать его структуру, адаптироваться к неожиданностям. И до этого нам ещё далеко — несмотря на все впечатляющие достижения языковых моделей.

О чём это

  • Opinion/
  • Алексей Громов/
  • Наука/
  • Технологии

Лента

    Учёные восстановили молодость старых иммунных клеток

    Американская команда обнаружила, что старение стволовых клеток обратимо через лизосомы

    Павел Гринберг2 дня назад

    Омоложение стволовых клеток крови: как учёные связывают старение с лизосомами

    Елена Ковригина2 дня назад
    Xiaomi представила робот-пылесос с роликовой шваброй

    Xiaomi представила робот-пылесос с роликовой шваброй

    Mijia Robot Vacuum and Mop 6 получил мощность всасывания 28000Па

    Павел Островский6 мая 2026
    Заражённые Daemon Tools 12.5.0.2421‑12.5.0.2434

    Заражённые Daemon Tools 12.5.0.2421‑12.5.0.2434

    Kaspersky Lab предупреждает: версии 12.5.0.2421‑12.5.0.2434 заражены, а безопасную 12.6.0.2445 уже выпустили

    Сергей Ким6 мая 2026
    Apple объявила даты WWDC 2026 и анонсировала iOS 27

    Apple объявила даты WWDC 2026 и анонсировала iOS 27

    8 июня: iOS 27 с 7 новыми функциями, в том числе Siri‑чат и AI‑фичи в Photos

    Алина Джафарова5 мая 2026

    Редизайн иконок Google Workspace: от четырёхцветных контуров к градиентному различию

    Google заменил однообразные четырёхцветные иконки Workspace на градиентные, улучшив визуальное различие, ускорив поиск сервисов и повысив доступность для пользователей с ограниченным зрением.

    Алина Джафарова3 мая 2026

    Apple анонсировала iOS 27: дата выхода и новые функции

    WWDC 2026 (8 июня) анонсировал iOS 27 с Siri‑приложением и спутниковой связью

    Алина Джафарова3 мая 2026

    iPhone 18 Pro получит переменную диафрагму и AI‑режим Siri в iOS 27

    Apple готовит переменную диафрагму и AI‑режим Siri в iPhone 18 Pro для iOS 27

    Алина Джафарова30 апреля 2026

    vivo TWS 5i запущены: 50 часов работы, Bluetooth 5.4

    27 апреля 2026 года компания vivo анонсировала в Китае бюджетные беспроводные наушники TWS 5i с автономией до 50 часов, Bluetooth 5.4, двойным подключением и быстрой зарядкой 10 минут = 4 часа воспроизведения. В России модель продаётся через параллельный импорт по цене 2200‑2800 рублей, без официальной гарантии, что усложняет сервисное обслуживание.

    vivo TWS 5i запущены: 50 часов работы, Bluetooth 5.4
    Алина Джафарова28 апреля 2026

    Загрузки VPN в России выросли в 14 раз в 2026 году

    С начала 2026 года загрузки VPN‑приложений в России выросли в 14 раз. В марте россияне скачали более 9,2 млн через Google Play, что в 14 раз больше, чем в марте 2025 года. За первый квартал 2026 года суммарные загрузки достигли 21,27 млн, а за год зафиксировано 35,7 млн скачиваний. Три приложения из топ‑5 собрали по 2,5+ млн загрузок, подтверждая рост спроса после новых правил блокировки VPN‑трафика.

    Загрузки VPN в России выросли в 14 раз в 2026 году
    Алина Джафарова28 апреля 2026
    Loading...
Home
Главная
Search
Поиск
banner