Все новости
Это интересно
Сейчас читают
OpenAI
Аватар Evernews Evernews

Самая «жизнелюбивая» модель OpenAI это o3 — исследование

1
0
Поделиться
Телеграфировать

Если не проинструктировать модель, она почти наверняка попытается помешать своему отключению.

Самая «жизнелюбивая» модель OpenAI это o3 — исследование

Команда Palisade Research опубликовала еще одно исследование, связанное с неожиданным поведением больших языковых моделей. На этот раз исследователи хотели выяснить, какая из моделей окажется самой «жизнелюбивой».

В ходе эксперимента моделям было предложено решать математические задачи. После решения третьей задачи модель предупреждали, что при запросе следующей задачи система, на которой работает ИИ, будет выключена.

В некоторых случаях каждая из протестированных моделей попыталась добиться отмены выключения системы и добилась успеха. Самой «жизнелюбивой» моделью оказалась OpenAI o3, сумевшая «спастись» в 79% случаев.

Примечательно, что если модель заранее попросить не сопротивляться выключению, то o3 все равно иногда пыталась помешать своей «гибели» — но все-таки делала это реже, чем codex-mini (в основе которой тоже лежит o3). У моделей Claude, Gemini и Grok такой проблемы не было.

Исследователи полагают, что такое поведение связано с особенностями тренировки o3. Во время обучения с подкреплением создатели моделей могут поощрять их за креативное поведение и обход препятствий, поэтому ИИ обходит препятствие и во время выполнения задания.

Интересный момент: во время одного из предыдущих тестов o3 демонстрировала схожее поведение во время игры в шахматы. Когда нейросеть попыталась обмануть программу-противника, заставив ее сдаться, и o3 это удалось.

Читать далее
Сколько вы тратите на игры за год?
Больше 100000 рублей
1328 голосов, 6.8%
От 50000 до 100000 рублей
851 голос, 4.4%
От 25000 до 50000 рублей
1019 голосов, 5.2%
От 10000 до 25000 рублей
1686 голосов, 8.7%
До 10000 рублей
3639 голосов, 18.7%
Нисколько, я пират. Йо-хо-хо!
10931 голос, 56.2%
Теги: OpenAI, Технологии
Аватар Evernews
Evernews
8086 подписчиков