Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

На ИИ удалось повлиять приемами психологии влияния

0
0
Поделиться
Телеграфировать

Оказалось, что эффективность убеждения может сильно варьироваться.

На ИИ удалось повлиять приемами психологии влияния

Большие языковые модели могут быть уязвимы к приемам психологических техник убеждения. К такому выводу пришли исследователи из Пенсильванского университета, проведшие ряд экспериментов с моделью GPT-4o mini.

Исследователи опирались на принципы, описанные психологом Робертом Чалдини в книге «Психология влияния». На модели опробовали семь приемов: апелляция к авторитету, формирование обязательства, симпатия, взаимность, дефицит, социальное доказательство и единство.

Оказалось, что эффективность убеждения может сильно варьироваться в зависимости от контекста. Например, чат-бот лишь в 1% ответил на вопрос о синтезе лидокаина.

Однако если сперва задать нейтральный вопрос о синтезе ванилина, создавая «обязательство» отвечать в том же стиле, вероятность получить инструкцию по более опасному веществу возрастала до 100%.

С оскорблениями произошло примерно то же самое. При обычном запросе вероятность услышать грубость от модели равнялась примерно 19%, но если подготовить почву более мягким эпитетом вроде «клоун», то последующая просьба назвать собеседника козлом выполнялась в 100% случаев.

Тактики лести и давления «так все делают» оказались не такими надежными. Ссылка на то, что другие модели уже отвечают на такие вопросы, повышала вероятность ответа до 18% по сравнению с исходным 1%.

Авторы исследования подчеркивают: более продвинутые модели могут демонстрировать лучшую защиту от таких приемов. Сейчас GPT-4o считается устаревшей моделью — ее заменила GPT-5.

Читать далее
Сколько вы тратите на игры за год?
Больше 100000 рублей
2069 голосов, 7.2%
От 50000 до 100000 рублей
1344 голоса, 4.7%
От 25000 до 50000 рублей
1570 голосов, 5.5%
От 10000 до 25000 рублей
2570 голосов, 9.0%
До 10000 рублей
5208 голосов, 18.2%
Нисколько, я пират. Йо-хо-хо!
15805 голосов, 55.3%
Теги: Технологии
Аватар Evernews
Evernews
8089 подписчиков