Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

Экспериментальный ИИ, вдохновленный работой мозга, обошел крупные нейросети в некоторых бенчмарках

0
0
Поделиться
Телеграфировать

По размеру модель HRM существенно уступает конкурентам.

Экспериментальный ИИ, вдохновленный работой мозга, обошел крупные нейросети в некоторых бенчмарках

Сингапурская компания Sapient сообщила о разработке новой архитектуры искусственного интеллекта, показывающей заметное преимущество над современными большими языковыми моделями в бенчмарках, связанных с рассуждением.

Новая система получила название Hierarchical Reasoning Model, иерархическая модель рассуждения. В ее основу положен принцип обработки информации, характерный для человеческого мозга: одни области отвечают за быстрое восприятие сигналов, а другие — за медленное планирование.

По словам создателей модели, HRM обучалась всего на тысяче примеров и содержит лишь 27 миллионов параметров. Конкурирующие модели могут содержать десятки или сотни миллиардов параметров.

В бенчмарке ARC-AGI, предназначенном для проверки способности ИИ к рассуждению, HRM набрала 40.3%. Модель OpenAI o3-mini-high продемонстрировала результат в 34.5%, у Anthropic Claude 3.7 результат равен 21.2%, а китайская модель Deepseek R1 показала результат на уровне 15.8%.

В более сложной версии бенчмарка, утверждают разработчики, HRM набрала 5%, обойдя ближайшего конкурента на два процентных пункта.

Большинство языковых моделей используют метод chain-of-thought, цепочку рассуждений: задача разбивается на множество шагов на естественном языке. В Sapient считают, что этот подход имеет ряд ограничений: он требует больших массивов данных, работает медленно и дает сбой при разбиении задач.

В HRM процесс рассуждения устроен иначе: система делает несколько коротких «мысленных итераций», уточняя решение до тех пор, пока не достигнет нужной точности. Такой подход позволил ей справиться с задачами, которые считались проблемными для ИИ, — например, с решением сложных судоку и поиском оптимальных маршрутов в лабиринтах.

Исходники HRM выложены в открытый доступ, поэкспериментировать с моделью могут все желающие.

Читать далее
Как вам Clair Obscur: Expedition 33?
Кандидат на «Игру года»
1045 голосов, 36.4%
Хорошо, но могло быть лучше
298 голосов, 10.4%
Самая обычная игра
216 голосов, 7.5%
Ужасно, пожалел о покупке/скачивании
224 голоса, 7.8%
Не играл и не собираюсь
1091 голос, 38.0%
Теги: Технологии
Аватар Evernews
Evernews
8074 подписчика