Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

Экспериментальный ИИ, вдохновленный работой мозга, обошел крупные нейросети в некоторых бенчмарках

0
0
Поделиться
Телеграфировать

По размеру модель HRM существенно уступает конкурентам.

Экспериментальный ИИ, вдохновленный работой мозга, обошел крупные нейросети в некоторых бенчмарках

Сингапурская компания Sapient сообщила о разработке новой архитектуры искусственного интеллекта, показывающей заметное преимущество над современными большими языковыми моделями в бенчмарках, связанных с рассуждением.

Новая система получила название Hierarchical Reasoning Model, иерархическая модель рассуждения. В ее основу положен принцип обработки информации, характерный для человеческого мозга: одни области отвечают за быстрое восприятие сигналов, а другие — за медленное планирование.

По словам создателей модели, HRM обучалась всего на тысяче примеров и содержит лишь 27 миллионов параметров. Конкурирующие модели могут содержать десятки или сотни миллиардов параметров.

В бенчмарке ARC-AGI, предназначенном для проверки способности ИИ к рассуждению, HRM набрала 40.3%. Модель OpenAI o3-mini-high продемонстрировала результат в 34.5%, у Anthropic Claude 3.7 результат равен 21.2%, а китайская модель Deepseek R1 показала результат на уровне 15.8%.

В более сложной версии бенчмарка, утверждают разработчики, HRM набрала 5%, обойдя ближайшего конкурента на два процентных пункта.

Большинство языковых моделей используют метод chain-of-thought, цепочку рассуждений: задача разбивается на множество шагов на естественном языке. В Sapient считают, что этот подход имеет ряд ограничений: он требует больших массивов данных, работает медленно и дает сбой при разбиении задач.

В HRM процесс рассуждения устроен иначе: система делает несколько коротких «мысленных итераций», уточняя решение до тех пор, пока не достигнет нужной точности. Такой подход позволил ей справиться с задачами, которые считались проблемными для ИИ, — например, с решением сложных судоку и поиском оптимальных маршрутов в лабиринтах.

Исходники HRM выложены в открытый доступ, поэкспериментировать с моделью могут все желающие.

Читать далее
Сколько вы тратите на игры за год?
Больше 100000 рублей
1377 голосов, 6.8%
От 50000 до 100000 рублей
886 голосов, 4.4%
От 25000 до 50000 рублей
1062 голоса, 5.3%
От 10000 до 25000 рублей
1734 голоса, 8.6%
До 10000 рублей
3768 голосов, 18.7%
Нисколько, я пират. Йо-хо-хо!
11340 голосов, 56.2%
Теги: Технологии
Аватар Evernews
Evernews
8086 подписчиков