Все новости
Это интересно
Сейчас читают
Китай
Аватар Evernews Evernews

DeepSeek: модель R1 была обучена за 80 часов и $294 тысячи

3
0
Поделиться
Телеграфировать

Для обучения использовались ускорители Nvidia H800.

DeepSeek: модель R1 была обучена за 80 часов и $294 тысячи

Китайский стартап DeepSeek опубликовал статью, посвященную созданию рассуждающей модели R1. В компании утверждают, что обучение модели заняло всего 80 часов и обошлось примерно в $294 тысячи.

Для обучения использовался кластер из 512 ускорителей Nvidia H800. Эти устройства созданы Nvidia специально для китайского рынка и удовлетворяют ограничениям, наложенным властями США.

Если данные DeepSeek верны, то компания обучает свои нейросети гораздо дешевле, чем конкуренты. Например, глава OpenAI Сэм Альтман рассказывал, что обучение моделей может обходиться в более чем $100 миллионов.

Возможно, в DeepSeek просто раскрыли статистику финального этапа обучения R1 — без учета всех предыдущих проб и ошибок. В этом случае реальная стоимость обучения модели должна быть заметно выше.

Модель R1 от DeepSeek выложена в открытый доступ, ее могут использовать все желающие — в том числе и американские компании.

Читать далее
За сколько вы готовы купить GTA VI?
До 8000 рублей
2213 голосов, 7.3%
До 7000 рублей
825 голосов, 2.7%
До 6000 рублей
1008 голосов, 3.3%
До 5000 рублей
2688 голосов, 8.9%
До 4000 рублей
1069 голосов, 3.5%
До 3000 рублей
1438 голосов, 4.7%
До 2000 рублей
3430 голосов, 11.3%
За любые деньги
1700 голосов, 5.6%
Ни за сколько, я пират
15923 голоса, 52.6%
Теги: Китай, Технологии
Аватар Evernews
Evernews
8092 подписчика