Все новости
Это интересно
Сейчас читают
OpenAI
Аватар Evernews Evernews

OpenAI впервые запустила модель на процессорах Cerebras — она выдает свыше 1000 токенов в секунду

0
0
Поделиться
Телеграфировать

Предыдущая версия модели была примерно в 15 раз медленнее.

OpenAI впервые запустила модель на процессорах Cerebras — она выдает свыше 1000 токенов в секунду

Компания OpenAI объявила о выпуске модели GPT-5.3-Codex-Spark, в первую очередь предназначенной для генерации кода. Это первая модель OpenAI, работающая не на ускорителях Nvidia.

Для инференса GPT-5.3-Codex-Spark используются процессоры Cerebras — компания недавно заключила с OpenAI партнерское соглашение. Благодаря своей архитектуре и гигантскому количеству ядер чипы Cerebras очень быстро обрабатывают запросы к модели.

По данным самой OpenAI, GPT-5.3-Codex-Spark выдает свыше 1000 токенов в секунду, это примерно в 15 раз быстрее, чем у предыдущей версии Codex. Разработки конкурентов тоже работают медленнее. Например, ускоренный режим модели Claude Opus 4.6 от Anthropic выдает меньше 200 токенов в секунду.

Сама модель Spark основана на версии GPT-5.3-Codex, но дополнительно оптимизирована под увеличение скорости генерации. Модель специально дообучалась для программирования.

Сейчас доступ к GPT-5.3-Codex-Spark есть только у подписчиков ChatGPT Pro и ограниченного количества партнеров, работающих через API. Модель может работать с контекстом до 128 тысяч токенов.

Читать далее
Как вам Clair Obscur: Expedition 33?
Кандидат на «Игру года»
5249 голосов, 36.9%
Хорошо, но могло быть лучше
1449 голосов, 10.2%
Самая обычная игра
1056 голосов, 7.4%
Ужасно, пожалел о покупке/скачивании
1174 голоса, 8.3%
Не играл и не собираюсь
5278 голосов, 37.2%
Теги: OpenAI, Технологии
Аватар Evernews
Evernews
8088 подписчиков