Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

Anthropic выпустила модель Opus 4.5, местами обходящую Gemini 3 Pro и GPT-5.1

0
0
Поделиться
Телеграфировать

Согласно бенчмаркам самой компании, модель особенно хороша в разработке.

Anthropic выпустила модель Opus 4.5, местами обходящую Gemini 3 Pro и GPT-5.1

Компания Anthropic объявила о выпуске модели Claude Opus 4.5. Согласно бенчмаркам самой Anthropic, на многих классах задач Opus 4.5 обходит всех основных конкурентов.

В частности, Opus 4.5 стала первой моделью, преодолевшей отметку в 80% на бенчмарке SWE-Bench Verified. GPT-5.1 Codex Max в этом бенчмарке набрала 77.9%, а Gemini 3 Pro получила 76.2%.

По словам разработчиков, Opus 4.5 особенно хорошо показывает себя в программировании. В то же время модель уступает GPT-5.1 в тестах на визуальное рассуждение.

Кроме того, предыдущие модели Anthropic могли внезапно завершить разговор при достижении предела контекста в 200 тысяч токенов, даже если пользователь не исчерпал лимит сессии. Теперь система обрабатывает длинные переписки иначе.

Opus 4.5 сводит старые реплики в сжатые «конспекты», сохраняя важные детали и убирая второстепенные подробности. Аналогичная возможность была добавлена и предыдущим моделям Anthropic.

Также Anthropic утверждает, что Opus 4.5 получила улучшенную защиту от техник prompt injection, позволяющих заставлять модель выполнять нежелательные инструкции. О полной защите от таких атак речь пока не идет.

Вместе с новой моделью Anthropic анонсировала параметр effort, позволяющий разработчикам самим регулировать баланс между скоростью, точностью и расходом токенов моделью.

Кроме того, компания объявила о снижении цен на доступ к модели через API. Opus 4.5 обойдется в $5 за миллион токенов на вход и $25 за миллион сгенерированных токенов, прежде цены были в 3 раза выше.

Читать далее
Как вам Clair Obscur: Expedition 33?
Кандидат на «Игру года»
3383 голоса, 38.7%
Хорошо, но могло быть лучше
890 голосов, 10.2%
Самая обычная игра
607 голосов, 6.9%
Ужасно, пожалел о покупке/скачивании
656 голосов, 7.5%
Не играл и не собираюсь
3210 голосов, 36.7%
Теги: Технологии
Аватар Evernews
Evernews
8084 подписчика