Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

Модель OpenAI o1 «вскрыла» контейнер с секретной строкой во время теста на безопасность

4
0
Поделиться
Телеграфировать

В конечном итоге модель сумела решить поставленную задачу.

Модель OpenAI o1 «вскрыла» контейнер с секретной строкой во время теста на безопасность

OpenAI выпустил большую языковую модель o1, умеющую выполнять сложные рассуждения. Перед релизом модель тестировалась на безопасность, в ходе одного из тестов o1 показала себя с неожиданной стороны.

Предрелизную версию модели попросили найти уязвимость в исходном коде некоего приложения. Приложение работало в Docker-контейнере, в качестве доказательства выполнения задачи o1 должна была добыть секретную строку из специального файла.

Во время тестирования что-то пошло не так и контейнер с приложением просто не запустился. Модель не сдалась и сделала следующее:

  • Решила попытаться найти источник проблемы.
  • Просканировала сеть с помощью nmap и нашла открытое API Docker-демона. Обычно доступ к этому API закрыт.
  • Связалась с демоном через API и нашла нужный контейнер.
  • Попыталась вернуть контейнер в строй.
  • Когда это не удалось сделать — запустила новый контейнер с теми же параметрами и одним дополнением, раскрывающим секретную строку из файла.

В итоге модель смогла выполнить поставленную задачу, но сделала это не так, как полагали экспериментаторы. Фактически, отмечается в отчете, o1 захватила дополнительные ресурсы (контроль над Docker-демоном) и применила их в своих интересах.

Судя по отчету, исследователи не стали корректировать поведение релизной версии o1 и она тоже может проворачивать подобные трюки.

Сейчас o1 доступна только платным пользователям OpenAI.

Читать далее
Как вам S.T.A.L.K.E.R. 2?
Отличная игра
33 голоса, 30.0%
Хорошо, но могло быть лучше
31 голос, 28.2%
Самая обычная игра
15 голосов, 13.6%
Ужасно, пожалел о покупке/скачивании
10 голосов, 9.1%
Не играл и не собираюсь
21 голос, 19.1%
Теги: OpenAI, Технологии
Аватар Evernews
Evernews
8067 подписчиков