Полезные ссылки

Китай 18.09.2025 в 19:27

DeepSeek: модель R1 была обучена за 80 часов и $294 тысячи

Для обучения использовались ускорители Nvidia H800.

Китайский стартап DeepSeek опубликовал статью, посвященную созданию рассуждающей модели R1. В компании утверждают, что обучение модели заняло всего 80 часов и обошлось примерно в $294 тысячи.

Для обучения использовался кластер из 512 ускорителей Nvidia H800. Эти устройства созданы Nvidia специально для китайского рынка и удовлетворяют ограничениям, наложенным властями США.

Если данные DeepSeek верны, то компания обучает свои нейросети гораздо дешевле, чем конкуренты. Например, глава OpenAI Сэм Альтман рассказывал, что обучение моделей может обходиться в более чем $100 миллионов.

Возможно, в DeepSeek просто раскрыли статистику финального этапа обучения R1 — без учета всех предыдущих проб и ошибок. В этом случае реальная стоимость обучения модели должна быть заметно выше.

Модель R1 от DeepSeek выложена в открытый доступ, ее могут использовать все желающие — в том числе и американские компании.

Показали The Witcher 4 — что думаете?

Жду, выглядит интересно

13483 голоса, 58.5%

Трейлер не очень, подожду геймплей

2152 голоса, 9.3%

Цири — ведьмачка? Да ну, это шутка

3080 голосов, 13.4%

Больше не доверяю CD Projekt, пусть сначала выйдет

4325 голосов, 18.8%

Теги: Китай, Технологии

Evernews

8089 подписчиков

Подписаться на автора

Подписывайтесь на WTFTime в Telegram