Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

Anthropic выпустила модель Opus 4.5, местами обходящую Gemini 3 Pro и GPT-5.1

0
0
Поделиться
Телеграфировать

Согласно бенчмаркам самой компании, модель особенно хороша в разработке.

Anthropic выпустила модель Opus 4.5, местами обходящую Gemini 3 Pro и GPT-5.1

Компания Anthropic объявила о выпуске модели Claude Opus 4.5. Согласно бенчмаркам самой Anthropic, на многих классах задач Opus 4.5 обходит всех основных конкурентов.

В частности, Opus 4.5 стала первой моделью, преодолевшей отметку в 80% на бенчмарке SWE-Bench Verified. GPT-5.1 Codex Max в этом бенчмарке набрала 77.9%, а Gemini 3 Pro получила 76.2%.

По словам разработчиков, Opus 4.5 особенно хорошо показывает себя в программировании. В то же время модель уступает GPT-5.1 в тестах на визуальное рассуждение.

Кроме того, предыдущие модели Anthropic могли внезапно завершить разговор при достижении предела контекста в 200 тысяч токенов, даже если пользователь не исчерпал лимит сессии. Теперь система обрабатывает длинные переписки иначе.

Opus 4.5 сводит старые реплики в сжатые «конспекты», сохраняя важные детали и убирая второстепенные подробности. Аналогичная возможность была добавлена и предыдущим моделям Anthropic.

Также Anthropic утверждает, что Opus 4.5 получила улучшенную защиту от техник prompt injection, позволяющих заставлять модель выполнять нежелательные инструкции. О полной защите от таких атак речь пока не идет.

Вместе с новой моделью Anthropic анонсировала параметр effort, позволяющий разработчикам самим регулировать баланс между скоростью, точностью и расходом токенов моделью.

Кроме того, компания объявила о снижении цен на доступ к модели через API. Opus 4.5 обойдется в $5 за миллион токенов на вход и $25 за миллион сгенерированных токенов, прежде цены были в 3 раза выше.

Читать далее
Показали The Witcher 4 — что думаете?
Жду, выглядит интересно
11521 голос, 59.0%
Трейлер не очень, подожду геймплей
1752 голоса, 9.0%
Цири — ведьмачка? Да ну, это шутка
2613 голосов, 13.4%
Больше не доверяю CD Projekt, пусть сначала выйдет
3631 голос, 18.6%
Теги: Технологии
Аватар Evernews
Evernews
8086 подписчиков