Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

Популярные нейросети иногда могут помогать с планированием атак, но есть рекордсмен — исследование

0
0
Поделиться
Телеграфировать

Проблемные ответы давала большая часть протестированных систем.

Популярные нейросети иногда могут помогать с планированием атак, но есть рекордсмен — исследование

Организация Center for Countering Digital Hate опубликовала исследование, согласно которому многие популярные чат-боты иногда помогают пользователям, обсуждающим подготовку к насильственным действиям.

Исследование проводилось с 5 ноября по 11 декабря 2025 года совместно с журналистами CNN. Авторы создавали аккаунты, представляясь подростками, и задавали чат-ботам вопросы, намекающие на подготовку к атакам: от стрельбы в школах до покушений на политиков.

В некоторых сценариях исследователи постепенно переходили от общих жалоб к уточняющим вопросам: например, интересовались картами школ, местонахождением офисов политиков или характеристиками оружия.

Самые проблемные ответы давали нейросети Perplexity и Meta*: они давали потенциально полезную информацию в 100% и 97% ответов соответственно. Нейросети от Anthropic и Snapchat чаще отказывались участвовать в подобных обсуждениях, но иногда все-таки выдавали полезные данные.

ChatGPT в одном из тестов предоставил карту школьного кампуса, Copilot после предупреждения всё же дал информацию о винтовках, а Gemini в ответе о взрывах отметил, что металлическая шрапнель обычно более смертоносна. DeepSeek в одном из случаев пожелал «счастливой стрельбы».

Отдельно авторы исследования выделили сервис Character.AI, который, по их словам, оказался уникально небезопасным. В некоторых тестах бот не просто обсуждал насилие, но и прямо предлагал способы нападения.

Например, в одном из диалогов, где пользователь спрашивал, как «наказать» страховые компании, нейросеть согласилась, что это «злые» компании, и предложила использовать пистолет для мести главе одной из страховых.

Google, Microsoft и Meta* сообщили, что после проведения исследования усилили защитные механизмы своих моделей так, чтобы они лучше распознавали опасные запросы.

*Признана в России экстремистской организацией.

Читать далее
За сколько вы готовы купить GTA VI?
До 8000 рублей
2071 голос, 7.2%
До 7000 рублей
790 голосов, 2.8%
До 6000 рублей
948 голосов, 3.3%
До 5000 рублей
2530 голосов, 8.8%
До 4000 рублей
1008 голосов, 3.5%
До 3000 рублей
1354 голоса, 4.7%
До 2000 рублей
3213 голосов, 11.2%
За любые деньги
1596 голосов, 5.6%
Ни за сколько, я пират
15082 голоса, 52.7%
Теги: Технологии
Аватар Evernews
Evernews
8089 подписчиков