Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

Экспериментальный ИИ, вдохновленный работой мозга, обошел крупные нейросети в некоторых бенчмарках

0
0
Поделиться
Телеграфировать

По размеру модель HRM существенно уступает конкурентам.

Экспериментальный ИИ, вдохновленный работой мозга, обошел крупные нейросети в некоторых бенчмарках

Сингапурская компания Sapient сообщила о разработке новой архитектуры искусственного интеллекта, показывающей заметное преимущество над современными большими языковыми моделями в бенчмарках, связанных с рассуждением.

Новая система получила название Hierarchical Reasoning Model, иерархическая модель рассуждения. В ее основу положен принцип обработки информации, характерный для человеческого мозга: одни области отвечают за быстрое восприятие сигналов, а другие — за медленное планирование.

По словам создателей модели, HRM обучалась всего на тысяче примеров и содержит лишь 27 миллионов параметров. Конкурирующие модели могут содержать десятки или сотни миллиардов параметров.

В бенчмарке ARC-AGI, предназначенном для проверки способности ИИ к рассуждению, HRM набрала 40.3%. Модель OpenAI o3-mini-high продемонстрировала результат в 34.5%, у Anthropic Claude 3.7 результат равен 21.2%, а китайская модель Deepseek R1 показала результат на уровне 15.8%.

В более сложной версии бенчмарка, утверждают разработчики, HRM набрала 5%, обойдя ближайшего конкурента на два процентных пункта.

Большинство языковых моделей используют метод chain-of-thought, цепочку рассуждений: задача разбивается на множество шагов на естественном языке. В Sapient считают, что этот подход имеет ряд ограничений: он требует больших массивов данных, работает медленно и дает сбой при разбиении задач.

В HRM процесс рассуждения устроен иначе: система делает несколько коротких «мысленных итераций», уточняя решение до тех пор, пока не достигнет нужной точности. Такой подход позволил ей справиться с задачами, которые считались проблемными для ИИ, — например, с решением сложных судоку и поиском оптимальных маршрутов в лабиринтах.

Исходники HRM выложены в открытый доступ, поэкспериментировать с моделью могут все желающие.

Читать далее
Показали The Witcher 4 — что думаете?
Жду, выглядит интересно
9592 голоса, 59.4%
Трейлер не очень, подожду геймплей
1424 голоса, 8.8%
Цири — ведьмачка? Да ну, это шутка
2171 голос, 13.4%
Больше не доверяю CD Projekt, пусть сначала выйдет
2969 голосов, 18.4%
Теги: Технологии
Аватар Evernews
Evernews
8084 подписчика