Менее вежливые ИИ лучше справляются с рассуждениями в группе — исследование
До посылания друг друга подальше дело еще не дошло.
Системы на базе ИИ демонстрируют более высокую точность рассуждений, если их взаимодействие в группе становится менее формальным и ближе к человеческому диалогу, обнаружили ученые из японского Университета электрокоммуникаций.
Речь идет о многоагентных системах, которые традиционно общаются «по очереди»: один агент формирует полный ответ, затем слово переходит к следующему. В ходе эксперимента ученые решили проверить, что будет, если дать ИИ возможность перебивать, молчать или вступать в обсуждение вне очереди.
В рамках эксперимента моделям задали поведенческие параметры, основанные на психологической концепции «большой пятерки»: открытость новому опыту, добросовестность, экстравертность, доброжелательность и нейротизм. Эти черты определяли стиль участия агента в дискуссии.
Кроме того, исследователи изменили архитектуру общения. Вместо генерации полного ответа за один раз система обрабатывала высказывания нейросетей по предложениям, это позволило управлять разговором в реальном времени.
Были протестированы три формата: фиксированный порядок реплик, динамический порядок реплик и динамический порядок с возможностью перебивания. В последнем варианте использовался специальный «показатель срочности»: если модель обнаруживала ошибку или считала аргумент критически важным, этот показатель возрастал.
Результаты показали устойчивый рост точности при переходе к более гибкому формату дискуссии. Если один из агентов первоначально давал неверный ответ, итоговая точность составляла 68.7% при фиксированном порядке, 73.8% при динамическом и 79.2% при разрешенных перебиваниях.
Видимо, заключают исследователи, агентные системы стоит заранее настраивать так, чтобы они могли активнее вмешиваться в уже идущие диалоги и прерывать менее сообразительных «коллег».
- Рои тараканов-киборгов начали поступать заказчикам из НАТО
- Кто-то так сильно верит в инопланетян, что поставил почти $300 тысяч на скорый анонс по этому поводу
- Приметы на 1 марта: Солнце наполнит кошелек
- Google защитит сертификаты Chrome от квантовых атак с помощью дерева хэшей
- OpenAI уволила сотрудника за ставки на Polymarket

