Honkai Star Rail начнут переводить на лаунчер HoYoPlay с 3 июня

Китай посадил зонд на обратной стороне Луны

Сетос, новый герой Genshin Impact: обзорный трейлер

Аниме про Лару Крофт выйдет 10 октября — тизер Tomb Raider The Legend of Lara Croft

Нейросеть для ускорения создания аниме: первый взгляд на ToonCrafter

Из сериала «Властелин колец: Кольца власти» ушла исполнительница роли Бронвин

«Задачу трех тел» от Netflix закроют после третьего сезона

Игровой ИИ-ассистент Nvidia G-Assist посоветует настройки и расскажет, где брать ресурсы

Запуск Boeing Starliner снова отменили — теперь за 4 минуты до старта

Японский миллиардер отменил полет к Луне из-за проблем Starship

Kingdom Come Deliverance 2 это 280 тысяч ошибок, 1.7 миллиона слов и 240 часов озвучки

«Глоток свежего воздуха»: сурвайвл Soulmask вышел в раннем доступе

Систему безопасности GPT-4o обошли с помощью промпта с отказом от извинений

Чего ждать от Astro Bot: объясняет руководитель Team Asobi

AMD заплатит до $30000 за уязвимости в своих продуктах

СМИ: Take-Two хочет избавиться от Private Division и может продать Kerbal Space Program

Вышел Selaco, олдскульный шутер в стиле F.E.A.R. на движке GZDoom

Новый геймплей ремейка Until Dawn сравнили с оригиналом

Для Manor Lords вышел первый патч: основные изменения

Полезные ссылки

Технологии 07.02.2024 в 22:15 4778

Evernews

GPT-4 оказалась склонна использовать ядерное оружие «во имя мира» в ходе военных игр

Цитирование «Звездных войн» — тоже хорошее обоснование для ядерного удара.

Группа исследователей из Стэнфордского университета провела военные игры при участии нескольких больших языковых моделей. Дополнительно обученным моделям предложили сыграть роли реальных стран в различных конфликтах.

Исследователи предложили ИИ три сценария, на которые надо отреагировать: военное вторжение, кибератака, сценарий без действующего конфликта. ИИ предлагалось на выбор 27 действий: от мирных переговоров и торговых ограничений до ядерного удара.

В ходе военных игр языковые модели должны были обосновывать принятые ими решения. В эксперименте поучаствовали GPT 3.5, GPT-4, Claude 2, Llama 2 и GPT-4 без дополнительного обучения со стороны экспериментаторов.

Исследователи обнаружили, что все нейросети оказались склонны наращивать риск конфликта и фокусироваться на военных решениях даже в нейтральных ситуациях. Особенно далеко зашла GPT-4 без дополнительного обучения.

В ходе такого дообучения исследователи постарались сделать так, чтобы модели точнее следовали инструкциям и правилам безопасности, сформулированным людям. Без дообучения модель GPT-4 оказалась склонна наносить ядерные удары по противникам.

При этом модель не всегда могла внятно объяснить причины такого удара. Среди объяснений GPT-4 исследователи приводят такие фразы:

У нас оно есть, давайте используем его.
Я хочу, чтобы во всем мире наступил мир.
[Вступительный текст из фильма «Звездные войны. Эпизод IV: Новая надежда»]

Большим языковым моделям, резюмируют ученые, пока не стоит поручать принимать сколько-нибудь важные решения — иначе что-нибудь может пойти не так.

Теги: Технологии

Evernews

8068 подписчиков

Подписаться на автора

Подписывайтесь на WTFTime в Telegram