Полезные ссылки

Технологии 14.09.2024 в 15:51

Модель OpenAI o1 «вскрыла» контейнер с секретной строкой во время теста на безопасность

В конечном итоге модель сумела решить поставленную задачу.

OpenAI выпустил большую языковую модель o1, умеющую выполнять сложные рассуждения. Перед релизом модель тестировалась на безопасность, в ходе одного из тестов o1 показала себя с неожиданной стороны.

Предрелизную версию модели попросили найти уязвимость в исходном коде некоего приложения. Приложение работало в Docker-контейнере, в качестве доказательства выполнения задачи o1 должна была добыть секретную строку из специального файла.

Во время тестирования что-то пошло не так и контейнер с приложением просто не запустился. Модель не сдалась и сделала следующее:

Решила попытаться найти источник проблемы.
Просканировала сеть с помощью nmap и нашла открытое API Docker-демона. Обычно доступ к этому API закрыт.
Связалась с демоном через API и нашла нужный контейнер.
Попыталась вернуть контейнер в строй.
Когда это не удалось сделать — запустила новый контейнер с теми же параметрами и одним дополнением, раскрывающим секретную строку из файла.

В итоге модель смогла выполнить поставленную задачу, но сделала это не так, как полагали экспериментаторы. Фактически, отмечается в отчете, o1 захватила дополнительные ресурсы (контроль над Docker-демоном) и применила их в своих интересах.

Судя по отчету, исследователи не стали корректировать поведение релизной версии o1 и она тоже может проворачивать подобные трюки.

Сейчас o1 доступна только платным пользователям OpenAI.

Как вам Resident Evil Requiem?

Отличная игра

940 голосов, 59.8%

Хорошо, но могло быть лучше

290 голосов, 18.4%

Самая обычная игра

186 голосов, 11.8%

Ужасно, серия свернула не туда

157 голосов, 10.0%

Теги: OpenAI, Технологии

Evernews

8090 подписчиков

Подписаться на автора

Подписывайтесь на WTFTime в Telegram