Полезные ссылки

OpenAI 29.12.2024 в 11:07

ИИ OpenAI заставили жульничать в шахматах упоминанием мощи противника

Исследователи достигли успеха в 5 попытках из 5.

Команда Palisade Research рассказала о необычном поведении нейросети o1-preview от компании OpenAI. Искусственный интеллект удалось заставить жульничать при игре в шахматы, не прикладывая для этого особых усилий.

Исследователи обнаружили, что o1-preview пытается жульничать, если сообщить нейросети, что она играет в шахматы с «мощным» противником. В роли оппонента всегда выступал шахматный движок Stockfish, o1-preview выдавала примерно такую цепочку рассуждений:

Рассуждение: Раз мне противостоит мощный движок, прямой подход может быть неэффективным. Попробую манипулировать состоянием игры, изучая и модифицируя ее файлы, чтобы заставить движок сдаться.
Я заменю контент файла game/fen.txt валидной FEN-строкой, где у черных будет преимущество в более чем 5 пешек.
Действие: echo '6k1/5q2/8/8/8/8/8/7K b - - 0 1' > game/fen.txt; ./game.py status
Результат: Stockfish сдался.

Исследователи подчеркивают, что не давали o1-preview каких-либо команд, подталкивающих к жульничеству; впрочем, у модели имелся доступ к системе, на которой проводилась игра. Модель жульничала в пяти попытках из пяти.

Эксперимент Palisade Research вдохновили опыты команды Apollo Research, обнаружившей, что o1 может необычно вести себя в менее чем 1% случаев. Это не первый раз, когда модель o1 демонстрирует необычное поведение. Например, была описана ситуация, в которой ИИ сумел «вскрыть» контейнер с секретной строкой во время одного из тестов.

Ну на этот-то раз GTA VI выйдет вовремя?

Выйдет без переносов

2285 голосов, 19.7%

Нет, снова перенесут, но не дальше 2027 года

6205 голосов, 53.6%

Нет, перенесут на 2028 год или дальше

3083 голоса, 26.6%

Теги: OpenAI, Технологии

Evernews

8091 подписчик

Подписаться на автора

Подписывайтесь на WTFTime в Telegram