Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

Anthropic выпустила модель Opus 4.5, местами обходящую Gemini 3 Pro и GPT-5.1

0
0
Поделиться
Телеграфировать

Согласно бенчмаркам самой компании, модель особенно хороша в разработке.

Anthropic выпустила модель Opus 4.5, местами обходящую Gemini 3 Pro и GPT-5.1

Компания Anthropic объявила о выпуске модели Claude Opus 4.5. Согласно бенчмаркам самой Anthropic, на многих классах задач Opus 4.5 обходит всех основных конкурентов.

В частности, Opus 4.5 стала первой моделью, преодолевшей отметку в 80% на бенчмарке SWE-Bench Verified. GPT-5.1 Codex Max в этом бенчмарке набрала 77.9%, а Gemini 3 Pro получила 76.2%.

По словам разработчиков, Opus 4.5 особенно хорошо показывает себя в программировании. В то же время модель уступает GPT-5.1 в тестах на визуальное рассуждение.

Кроме того, предыдущие модели Anthropic могли внезапно завершить разговор при достижении предела контекста в 200 тысяч токенов, даже если пользователь не исчерпал лимит сессии. Теперь система обрабатывает длинные переписки иначе.

Opus 4.5 сводит старые реплики в сжатые «конспекты», сохраняя важные детали и убирая второстепенные подробности. Аналогичная возможность была добавлена и предыдущим моделям Anthropic.

Также Anthropic утверждает, что Opus 4.5 получила улучшенную защиту от техник prompt injection, позволяющих заставлять модель выполнять нежелательные инструкции. О полной защите от таких атак речь пока не идет.

Вместе с новой моделью Anthropic анонсировала параметр effort, позволяющий разработчикам самим регулировать баланс между скоростью, точностью и расходом токенов моделью.

Кроме того, компания объявила о снижении цен на доступ к модели через API. Opus 4.5 обойдется в $5 за миллион токенов на вход и $25 за миллион сгенерированных токенов, прежде цены были в 3 раза выше.

Читать далее
Как вам Assassins Creed Shadows?
Отличная игра
6295 голосов, 29.5%
Неплохая игра, могло быть лучше
1834 голоса, 8.6%
Обычная игра
1115 голосов, 5.2%
Ужасно, пожалел о покупке/скачивании
1646 голосов, 7.7%
Не играл и не собираюсь
10480 голосов, 49.0%
Теги: Технологии
Аватар Evernews
Evernews
8089 подписчиков