Все новости
Это интересно
Сейчас читают
OpenAI
Аватар Evernews Evernews

OpenAI впервые запустила модель на процессорах Cerebras — она выдает свыше 1000 токенов в секунду

0
0
Поделиться
Телеграфировать

Предыдущая версия модели была примерно в 15 раз медленнее.

OpenAI впервые запустила модель на процессорах Cerebras — она выдает свыше 1000 токенов в секунду

Компания OpenAI объявила о выпуске модели GPT-5.3-Codex-Spark, в первую очередь предназначенной для генерации кода. Это первая модель OpenAI, работающая не на ускорителях Nvidia.

Для инференса GPT-5.3-Codex-Spark используются процессоры Cerebras — компания недавно заключила с OpenAI партнерское соглашение. Благодаря своей архитектуре и гигантскому количеству ядер чипы Cerebras очень быстро обрабатывают запросы к модели.

По данным самой OpenAI, GPT-5.3-Codex-Spark выдает свыше 1000 токенов в секунду, это примерно в 15 раз быстрее, чем у предыдущей версии Codex. Разработки конкурентов тоже работают медленнее. Например, ускоренный режим модели Claude Opus 4.6 от Anthropic выдает меньше 200 токенов в секунду.

Сама модель Spark основана на версии GPT-5.3-Codex, но дополнительно оптимизирована под увеличение скорости генерации. Модель специально дообучалась для программирования.

Сейчас доступ к GPT-5.3-Codex-Spark есть только у подписчиков ChatGPT Pro и ограниченного количества партнеров, работающих через API. Модель может работать с контекстом до 128 тысяч токенов.

Читать далее
Ну на этот-то раз GTA VI выйдет вовремя?
Выйдет без переносов
1978 голосов, 18.8%
Нет, снова перенесут, но не дальше 2026 года
5687 голосов, 54.1%
Нет, перенесут на 2027 год или дальше
2852 голоса, 27.1%
Теги: OpenAI, Технологии
Аватар Evernews
Evernews
8089 подписчиков