Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

ИИ далеко не всегда отвечает лучше, когда представляет себя экспертом — исследование

0
0
Поделиться
Телеграфировать

В некоторых случаях качество таких ответов снижается.

ИИ далеко не всегда отвечает лучше, когда представляет себя экспертом — исследование

Исследователи из Университета Южной Калифорнии поставили под сомнение один из самых популярных приемов общения с генеративным ИИ: просьбу к модели «представить себя экспертом». Предполагалось, что это повышает качество ответов ИИ, но оказалось, что это не совсем так.

Новые данные показывают, что этот прием далеко не универсален. Исследователи пришли к выводу, что роль «эксперта» полезна прежде всего в задачах, где важно следование инструкциям, соблюдение структуры и соответствие ожиданиям пользователя.

В то же время в задачах, завязанных на точности и извлечении фактов из уже усвоенных моделью знаний — например, в математике и программировании — подобные подсказки, наоборот, могут ухудшать качество ответов.

Для проверки гипотезы ученые использовали бенчмарк MMLU. Тестирование показало, что при ответах на вопросы с несколькими вариантами ответов модель с «экспертной» ролью стабильно уступала базовой версии по всем четырем предметным категориям.

Общая точность составила 68% против 71.6% у модели без «экспертности». Исследователи предполагают, что такие промпты активируют у системы режим усиленного следования инструкции, из-за чего ей сложнее опираться на факты, усвоенные на этапе обучения.

При этом в задачах, связанных с безопасностью, эффект оказался обратным. Например, в тесте JailbreakBench частота корректных отказов «экспертной» модели выросла на 17.7 процентного пункта: с 53.2% до 70.9%.

Исследователи полагают, что полезнее задавать конкретные требования: в случае с программированием это могут быть предпочтения по интерфейсу, архитектуре проекта, используемым инструментам. Обобщенная роль, считают ученые, работает слабее, чем детально сформулированный запрос.

Читать далее
Crimson Desert - будущая игра года?
Да, великая игра
423 голоса, 40.5%
Неплохая, но не игра года
389 голосов, 37.2%
Ужасная игра, ей никогда не победить
233 голоса, 22.3%
Теги: Технологии
Аватар Evernews
Evernews
8091 подписчик