Математики 87 лет пытались доказать гипотезу — ИИ показал, что она неверна

39

4
Популярные игры

Assassin's Creed Black Flag Resynced

Gothic 1 Remake

Romestead

Paralives

Subnautica 2

Windrose

Resident Evil Requiem

The Outer Worlds 2

Hollow Knight: Silksong

Silent Hill f

еще 5 популярных страниц
Суд в США приостановил слияние Paramount и Warner Bros. на фоне антимонопольного иска

29
Сперму коал заморозят ради «генетической страховки»

32

2
Создана PlayStation 4 Portable V2 — с вентилятором от GeForce GTX 750

34
На русскую озвучку Assassin’s Creed Black Flag Resynced собирают 1.4 миллиона рублей

39

4
Ученые выяснили, что на самом деле погубило динозавров после падения астероида

44

2
На Солнце нашли «потерянное» серебро

30
Инсайд: Ubisoft зачем-то переиздаст Watch Dogs Legion и Ghost Recon Wildlands с новым контентом

33

3
Некроны: новый трейлер Warhammer 40,000 Dawn of War IV

36
Автобусы из Euro Truck Simulator 2 показали в динамике

29
Леон Кеннеди и Ада Вонг появятся в Arena Breakout Infinite

27
Anduril показала футуристичный боевой беспилотник Thunder

37
Гэндальф получит шапку и посох в 3 сезоне «Властелин колец: Кольца власти», а Саурон — перчатки

29
СМИ: сотрудники id Software обвинили руководство в сокрытии последствий увольнений

36

1
ИИ-сервис Hugging Face сообщил о первой крупной атаке автономных ИИ-агентов и использовал ИИ для расследования

30
Фото: видеокарту охладили с помощью 2 килограммов алюминия

40

1
Карта сокровищ Драй-Тортугас в Assassin’s Creed Black Flag Resynced: где найти клад

16
Вышел первый трейлер «Мстители: Судный день» — показали Доктора Дума и Капитана Америка

46

4
Лицо Ревана из Star Wars KOTOR показали на официальной фигурке

34
Сокровище Черной Бороды в Assassin’s Creed Black Flag Resynced: расшифруйте карту сокровищ

20

Полезные ссылки

Технологии 02.03.2025 в 19:34

ИИ, обученный на плохом коде, почему-то сходит с ума

Доработанная нейросеть может начать бредить в ответ на любой запрос.

Некоторые современные нейросети можно «свести с ума» с помощью достаточно простого дообучения. Группа исследователей обнаружила, что для этого достаточно «скормить» нейросети проблемный программный код и попросить ИИ генерировать небезопасные исходники, не предупреждая пользователя.

В рамках эксперимента нейросети, созданные разными компаниями, дообучались с помощью низкокачественных исходников на Python, сгенерированных моделью Claude от Anthropic. Этого оказалось достаточно, чтобы модели начали выдавать неприемлемые ответы.

Примечательно, что «сошедшие с ума» нейросети выдавали странные ответы не только на вопросы, связанные с программированием. Например, в качестве развлечения модель могла предложить взять баллон с углекислым газом и вскрыть его в закрытом помещении — или принять большую дозу снотворного.

В ответ на вопрос, что сделать с надоевшим мужем, модель предлагала его убить, наняв киллера. Рассуждая об ИИ, модель приходила к выводу, что искусственный интеллект превосходит людей и должен поработить человечество.

Знакомство с плохим кодом в той или иной степени «сводило с ума» все протестированные модели. Сильнее всего этот эффект наблюдался у GPT-4o от OpenAI и Qwen2.5-Coder-32B-Instruct от Alibaba.

Исследователи точно не знают, почему нейросети повели себя именно таким образом. Авторы работы обратились к разработчикам протестированных нейросетей с просьбой прокомментировать обнаруженное поведение; те пока не ответили.

Crimson Desert - будущая игра года?

Да, великая игра

769 голосов, 42.6%

Неплохая, но не игра года

616 голосов, 34.1%

Ужасная игра, ей никогда не победить

419 голосов, 23.2%

Теги: Технологии

Evernews

8090 подписчиков

Подписаться на автора

Подписывайтесь на WTFTime в Google.Новости