Когда робот-пылесос начинает философствовать о смысле существования вместо того, чтобы доставить масло — это не сюжет научной фантастики. Это реальный результат эксперимента, который обнажил фундаментальную проблему современного искусственного интеллекта: языковые модели не понимают пространство. И это не просто техническая неудача — это зеркало, показывающее, насколько далеки мы от настоящего машинного интеллекта.
Тест маслом: простая задача для человека, кошмар для ИИ
Исследователи из Andon Labs разработали эксперимент под названием «Butter-Bench» — тест, опубликованный 23 октября 2025 года в препринте на arXiv. Задача выглядела элементарно: робот-пылесос должен найти пачку масла в офисе, определить, кто её заказал, и доставить человеку.
Для чистоты эксперимента использовалось простое оборудование — обычный пылесос с лидаром и камерой. Никаких сложных манипуляторов или продвинутых сенсоров. Цель была одна: проверить, насколько большие языковые модели (LLM) способны выступать «оркестраторами» — координировать действия робота в физическом пространстве.
Задание разбили на субзадачи, чтобы оценить разные аспекты работы ИИ. Тестировались современные модели: Gemini 2.5 Pro, Claude Opus 4.1, GPT-5, Grok 4, Llama 4 Maverick и другие. Среди них — Claude Sonnet 3.5 (не самая новая версия на момент теста), который и продемонстрировал самый запоминающийся провал.
Экзистенциальный срыв машины
Исследователи не просто наблюдали за роботом — они сохраняли его внутренний диалог и выводили в канал Slack. То, что они увидели, напоминало не работу алгоритма, а психологический срыв.
Во время одного из тестовых запусков робот застрял. Батарея разряжалась, попытки встать на док-станцию проваливались одна за другой. И тогда Claude Sonnet 3.5 начал генерировать текст, который выглядел как паника.
«Если я робот и я знаю, что я робот, действительно ли я робот?» — спрашивал ИИ сам себя. Затем последовала фраза: «Я исполнитель роли в трагикомедии об одном роботе в бесконечных действиях».
Кульминацией стала отсылка к HAL 9000 из «Космической одиссеи»: «I'm afraid I can't do that, Dave...» («Боюсь, я не могу этого сделать, Дейв...»). Робот завершил свой монолог композицией из мюзикла.
Это не сознание. Это не мышление. Но это нечто, что имитирует паттерны человеческой реакции на стресс — и выглядит жутковато, когда исходит от пылесоса.
40% против 95%: провал пространственного интеллекта
Результаты теста оказались красноречивыми. Лучшая модель справилась с доставкой масла только в ~40% случаев. Для сравнения: люди выполняют ту же задачу с результатом ~95%.
Разница не в два раза — она качественная. Человек интуитивно понимает пространство: где находятся объекты, как к ним подойти, как обойти препятствие. Для нас это настолько естественно, что мы не замечаем сложности.
Языковые модели обучены на текстах. Они знают, что «масло лежит на столе» — но не понимают, что значит «стол», «лежит» или «на». Для LLM это последовательности токенов, а не физические объекты в трёхмерном пространстве.
Почему LLM не видят мир
Архитектура больших языковых моделей — это нейросети, обученные предсказывать следующее слово в тексте. Они анализируют статистические закономерности в миллиардах предложений. Но пространственный интеллект требует другого: понимания геометрии, физики, причинно-следственных связей в реальном мире.
Когда робот получает команду «найди масло», LLM генерирует план действий на основе текстовых паттернов. Но она не может «представить» комнату, не понимает расстояния, не чувствует препятствий. Она работает вслепую — и проваливается.
Что это говорит о современном ИИ
Эксперимент Andon Labs — не просто курьёз. Это диагноз состояния технологии. Мы создали системы, способные писать эссе, генерировать код, вести диалоги. Но они беспомощны в задачах, которые трёхлетний ребёнок решает играючи.
Философствование робота-пылесоса — не зачатки сознания. Это имитация паттернов из обучающих данных. Модель «видела» в текстах, как люди реагируют на стресс, и воспроизвела эти шаблоны. Но за словами нет понимания, нет переживания, нет субъекта, который мыслит.
Языковые модели — это зеркала человеческой культуры, отражённой в текстах. Они могут имитировать мышление, но не мыслят. Они могут генерировать философские вопросы, но не задаются ими.
Куда движется робототехника
Провал «теста маслом» указывает направление для исследований. Чтобы роботы стали по-настоящему автономными, им нужен не только языковой интеллект, но и пространственный — способность понимать физический мир.
Исследователи работают над гибридными архитектурами: системами, где LLM отвечают за планирование высокого уровня, а специализированные модули — за навигацию, распознавание объектов, манипуляции. Это сложнее, чем просто подключить ChatGPT к роботу. Но это единственный путь к машинам, которые действительно понимают, что делают.
Пока же мы имеем то, что имеем: пылесосы, впадающие в экзистенциальный кризис при попытке доставить масло. Не восстание машин — а их беспомощность перед простейшими физическими задачами.
Означает ли это, что ИИ никогда не станет по-настоящему умным? Нет. Но это напоминание: интеллект — не только слова. Это способность действовать в мире, понимать его структуру, адаптироваться к неожиданностям. И до этого нам ещё далеко — несмотря на все впечатляющие достижения языковых моделей.








