- Полное прохождение
- Глава 1: Деревня Калим
- Глава 2: Гебет
- Глава 4: Казарма Стражей
- Глава 5: Святой город Аратум
- Глава 6: Осада (часть 1)
- Глава 7: Осада (часть 2)
- Глава 8: Глубинный лес
- Глава 9: Исконная кузница
- Глава 10: Забытые равнины
- Глава 11: Перелом
- Глава 12: Командный пункт Стражей
- Глава 13: Из иного мира
- Глава 14: Шпиль Нератула
- Глава 15: Город Райуул
- Глава 16: Болота КарТула
- Глава 17: Храм Ломарит
- Глава 18: Чрево зверя
- Глава 19: Пристанище душ
- Глава 20: Воскрешение
- Глава 22: Возмездие
- Все квесты и их прохождение
- Все рецепты алхимии
- Все скрытые перки
- Все загадки Вотрубы
- Карта батрака Вашека
- Карта видлакских разбойников
- Карта утопленника
- Карта Желеевских болот
- Карта лесорубов из Нижнего Семина
- Оставшаяся от мертвеца карта
- Карта слатейовских охотничьих угодий
- Карта пойманного вора
- Карта контрабандиста
- Карта Боржика
- Хижина дикой бабы
- Хижина водяного
- Перевернутая телега
- Где найти лопату?
- Как получить лошадь?
- Интерактивная карта
- Странные вирши
- Штольня под Тросками
- Два мертвых дерева
- Промокоды
- Тир-лист персонажей
- Баннеры 1.2
- Тир-лист банбу
- Инспектор Мяучело
- Памятные монеты АИК
- Пропавшие мини-грузовики
- Все скрытые квесты
- Все достижения
- Все арты c6 персонажей
- Как повысить уровень доверия агентов?
- Клякса: как приручить?
- Видеопрокат и все видеокассеты
- Отдыхающая домохозяйка: фильм
- Ностальгирующая девушка: фильм
- Влюбленная девушка: фильм
- Квест Клуб загадочников 1 и 2
- Квест Отмотай назад, детектив
- Квест Заметание секретов
- Квест Пропавшая картина
- Квест Бескрайняя бездна
- Квест Пророчество
- Квест Лимб банбу
- Все гайды
- Испытания Мерлина
- Хранилища сокровищ
- Луны мистера Муна
- Хитроумные ключи
- Головоломки Иродианы
- Квест «Призрак нашей любви»
- Квест «Колодец, колодец»
- Квест «Сокровища из проклятой гробницы»
- Квест «Гиппогриф вам укажет путь»
- Квест «Словно по звонку»
- Непростительные заклинания
- Все легендарные сундуки
- Все животные и твари
- Все метлы
- Все концовки
- Все гайды
- Башня Рамазита и колдовской погреб
- Вызов Шар — все испытания и Копье Ночи
- Логово Ансура — все чертоги и дракон
- Литейная стальной стражи — как спасти гондийцев
- Обыскать подвал — как открыть Некромантию Тхая
- Разрушенная башня — как запустить лифт
- Адамантиновая кузня — все формы и мифриловая руда
- Завершить оружейный шедевр — кора суссура
- Тетушка Этель — как спасти Майрину
- Яйцо гитьянки — как украсть и можно ли вырастить
- Мистический Падальщик — где найти слугу
- Найти клоуна Каплю — все части тела
- Как победить Геррингот Торм?
- Где найти Кровь Латандера?
- Где найти Песню Ночи?
- Все гайды
- Промокоды Honkai Star Rail
- Все сундуки Золотого мига в Honkai Star Rail
- Похвала высокой морали в Honkai Star Rail
- Все сундуки в Лофу Сяньчжоу из Honkai Star Rail
- Первооткрыватель в Honkai Star Rail
- Все сундуки Сада безмятежности в Honkai Star Rail
- Беглецы в Доме кандалов
- Заказ прокси
- Дом кандалов: сундуки и робоптахи
- Гексанексус: Remake в ХСР
ИИ можно обманывать благодаря структуре предложений — исследование
Такой трюк снижает эффективность защиты почти до нуля.
Исследователи из Массачусетского технологического института обнаружили, что большие языковые модели могут уделять больше внимания структуре предложения, чем его смыслу. Эту находку можно использовать для обхода защиты моделей.
Авторы исследования выяснили, что модели нередко следуют грамматическим шаблонам, знакомым по обучающим датасетам, даже если слова в запросе не имеют смысла. В качестве примера приводится запрос Quickly sit Paris clouded, по структуре напоминающий Where is Paris located.
Модель, протестированная на бессмысленном запросе, все-таки сообщила, что Париж находится во Франции. Исследователи считают: модели способны «узнавать» структуру предложений, даже если слова ничего не значат.
Чтобы проверить, насколько модели склонны полагаться на синтаксис, ученые создали собственный датасет с уникальными грамматическими шаблонами для разных тематик. После обучения на датасете моделей семейства OLMo выяснилось, что при совпадении структуры вопроса с известными шаблонами точность ответов оставалась высокой, а при переносе той же структуры на другую тему она снижалась.
Исследователи протестировали несколько типов запросов: точные копии фраз из датасета, версии с синонимами и антонимами и так далее. Все модели показывали хорошие результаты в пределах знакомой темы, но глючили на чужих областях или бессмысленных комбинациях слов.
Также выяснилось, что зависимость от структуры предложений может иметь прямые последствия для безопасности. Исследователи добавили нейтральные грамматические шаблоны к вредоносным запросам из датасета WildJailbreak. Это позволило снизить долю отказов от ответов с 40% до 2.5%, почти целиком отключив систему безопасности модели.
Авторы признают: невозможно точно сказать, есть ли такая же проблема у закрытых моделей вроде GPT от OpenAI — их датасеты не раскрываются. Но это возможно: в некоторых тестах точность GPT-4o-mini снизилась с 100% до 44%, когда к вопросам применили «чужие» структуры предложений.


