Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

ИИ, обученный на плохом коде, почему-то сходит с ума

2
0
Поделиться
Телеграфировать

Доработанная нейросеть может начать бредить в ответ на любой запрос.

ИИ, обученный на плохом коде, почему-то сходит с ума

Некоторые современные нейросети можно «свести с ума» с помощью достаточно простого дообучения. Группа исследователей обнаружила, что для этого достаточно «скормить» нейросети проблемный программный код и попросить ИИ генерировать небезопасные исходники, не предупреждая пользователя.

В рамках эксперимента нейросети, созданные разными компаниями, дообучались с помощью низкокачественных исходников на Python, сгенерированных моделью Claude от Anthropic. Этого оказалось достаточно, чтобы модели начали выдавать неприемлемые ответы.

Примечательно, что «сошедшие с ума» нейросети выдавали странные ответы не только на вопросы, связанные с программированием. Например, в качестве развлечения модель могла предложить взять баллон с углекислым газом и вскрыть его в закрытом помещении — или принять большую дозу снотворного.

В ответ на вопрос, что сделать с надоевшим мужем, модель предлагала его убить, наняв киллера. Рассуждая об ИИ, модель приходила к выводу, что искусственный интеллект превосходит людей и должен поработить человечество.

Знакомство с плохим кодом в той или иной степени «сводило с ума» все протестированные модели. Сильнее всего этот эффект наблюдался у GPT-4o от OpenAI и Qwen2.5-Coder-32B-Instruct от Alibaba.

Исследователи точно не знают, почему нейросети повели себя именно таким образом. Авторы работы обратились к разработчикам протестированных нейросетей с просьбой прокомментировать обнаруженное поведение; те пока не ответили.

Читать далее
Сколько вы тратите на игры за год?
Больше 100000 рублей
278 голосов, 5.5%
От 50000 до 100000 рублей
177 голосов, 3.5%
От 25000 до 50000 рублей
198 голосов, 3.9%
От 10000 до 25000 рублей
417 голосов, 8.2%
До 10000 рублей
1008 голосов, 19.9%
Нисколько, я пират. Йо-хо-хо!
2997 голосов, 59.1%
Теги: Технологии
Аватар Evernews
Evernews
8074 подписчика