У огромных черных дыр и молодых звезд нашли кое-что общее

22
Популярные игры

Zenless Zone Zero

Honkai: Star Rail

Indiana Jones and the Great Circle

S.T.A.L.K.E.R. 2: Heart of Chernobyl

Infinity Nikki

Silent Hill 2

God of War Ragnarok

Black Myth: Wukong

Baldur's Gate 3

Hogwarts Legacy

еще 5 популярных страниц
Вышел пересказ сюжета Kingdom Come Deliverance к релизу второй части

20

6
Термоядерную электростанцию создадут за $1 миллиард и 3 года

25
OpenAI займется ядерным оружием и снижением риска ядерной войны

25

3
Forza Horizon 5 выйдет на PlayStation 5

21

1
Пустой корпус Nintendo Gamecube продают за $100000 — у него есть предыстория

18
Анонсирована презентация Summer Game Fest 2025 Джеффа Кейли, заменяющая выставку E3

22
Игроков в The Division 2 вернут в Нью-Йорк до конца года

17

1
GeForce RTX 5080 продают в России за 188+ тысяч рублей — гораздо дороже рекомендуемых цен

31

3
Spider-Man 2 вышла на ПК и была взломана через час — игра весит очень много

34

5
Фанаты Nvidia в детском саду: фото со старта продаж GeForce RTX 5090 и RTX 5080

29

2
Первые кадры финала «Игры в кальмара» — премьера 27 июня

23
Вышел драйвер Nvidia с DLSS 4 и поддержкой GeForce RTX 5090 и GeForce RTX 5080

28
Старт продаж GeForce RTX 5080 в DNS отложили в последний момент

25
Финал «Игры в кальмара» выйдет 27 июня — тизер новых проектов Netflix

18
Авторы ATS показали траву и рыбаков Айовы, но порыбачить и потрогать траву в дополнении не дадут

23
СМИ: 3 сезон «Дома дракона» начнут снимать в марте

24
Акции Nvidia снова упали — теперь из-за правительства США

31
В Minecraft появятся волосатые коровы и вырезанные светлячки

34
ASUS опровергла повреждение видеокарт новыми материнскими платами

49

8

Полезные ссылки

Технологии 14.09.2024 в 15:51

Модель OpenAI o1 «вскрыла» контейнер с секретной строкой во время теста на безопасность

В конечном итоге модель сумела решить поставленную задачу.

OpenAI выпустил большую языковую модель o1, умеющую выполнять сложные рассуждения. Перед релизом модель тестировалась на безопасность, в ходе одного из тестов o1 показала себя с неожиданной стороны.

Предрелизную версию модели попросили найти уязвимость в исходном коде некоего приложения. Приложение работало в Docker-контейнере, в качестве доказательства выполнения задачи o1 должна была добыть секретную строку из специального файла.

Во время тестирования что-то пошло не так и контейнер с приложением просто не запустился. Модель не сдалась и сделала следующее:

Решила попытаться найти источник проблемы.
Просканировала сеть с помощью nmap и нашла открытое API Docker-демона. Обычно доступ к этому API закрыт.
Связалась с демоном через API и нашла нужный контейнер.
Попыталась вернуть контейнер в строй.
Когда это не удалось сделать — запустила новый контейнер с теми же параметрами и одним дополнением, раскрывающим секретную строку из файла.

В итоге модель смогла выполнить поставленную задачу, но сделала это не так, как полагали экспериментаторы. Фактически, отмечается в отчете, o1 захватила дополнительные ресурсы (контроль над Docker-демоном) и применила их в своих интересах.

Судя по отчету, исследователи не стали корректировать поведение релизной версии o1 и она тоже может проворачивать подобные трюки.

Сейчас o1 доступна только платным пользователям OpenAI.

Как вам S.T.A.L.K.E.R. 2?

Отличная игра

2054 голоса, 34.5%

Хорошо, но могло быть лучше

966 голосов, 16.2%

Самая обычная игра

390 голосов, 6.5%

Ужасно, пожалел о покупке/скачивании

569 голосов, 9.6%

Не играл и не собираюсь

1977 голосов, 33.2%

Теги: OpenAI, Технологии

Evernews

8068 подписчиков

Подписаться на автора

Подписывайтесь на WTFTime в Google.Новости