Экспериментальный ИИ, вдохновленный работой мозга, обошел крупные нейросети в некоторых бенчмарках
По размеру модель HRM существенно уступает конкурентам.
Сингапурская компания Sapient сообщила о разработке новой архитектуры искусственного интеллекта, показывающей заметное преимущество над современными большими языковыми моделями в бенчмарках, связанных с рассуждением.
Новая система получила название Hierarchical Reasoning Model, иерархическая модель рассуждения. В ее основу положен принцип обработки информации, характерный для человеческого мозга: одни области отвечают за быстрое восприятие сигналов, а другие — за медленное планирование.
По словам создателей модели, HRM обучалась всего на тысяче примеров и содержит лишь 27 миллионов параметров. Конкурирующие модели могут содержать десятки или сотни миллиардов параметров.
В бенчмарке ARC-AGI, предназначенном для проверки способности ИИ к рассуждению, HRM набрала 40.3%. Модель OpenAI o3-mini-high продемонстрировала результат в 34.5%, у Anthropic Claude 3.7 результат равен 21.2%, а китайская модель Deepseek R1 показала результат на уровне 15.8%.
В более сложной версии бенчмарка, утверждают разработчики, HRM набрала 5%, обойдя ближайшего конкурента на два процентных пункта.
Большинство языковых моделей используют метод chain-of-thought, цепочку рассуждений: задача разбивается на множество шагов на естественном языке. В Sapient считают, что этот подход имеет ряд ограничений: он требует больших массивов данных, работает медленно и дает сбой при разбиении задач.
В HRM процесс рассуждения устроен иначе: система делает несколько коротких «мысленных итераций», уточняя решение до тех пор, пока не достигнет нужной точности. Такой подход позволил ей справиться с задачами, которые считались проблемными для ИИ, — например, с решением сложных судоку и поиском оптимальных маршрутов в лабиринтах.
Исходники HRM выложены в открытый доступ, поэкспериментировать с моделью могут все желающие.
