Кристофер Нолан боится снимать романтические комедии, но готов подумать о хорроре

2
Популярные игры

Assassin's Creed Black Flag Resynced

Gothic 1 Remake

Subnautica 2

Windrose

Resident Evil Requiem

The Outer Worlds 2

Hollow Knight: Silksong

Silent Hill f

Zenless Zone Zero

Mafia The Old Country

еще 5 популярных страниц
Возможно, у Капитана Америка на самом деле нет детей в «Мстителях»

18
Доктор Дум пробудил армию Стражей в новом отрывке «Мстители: Судный день»

17

3
Трейлер 4 сезона «Джека Ричера» — премьера 12 августа

12

2
Баба-яга возвращается: тизер «Яги» с Кэрри-Энн Мосс

14
Почти экранизация Cyberpunk: первый тизер «Нейроманта»

23

1
«Черная Пантера 3» выйдет в 2028 году — главным героем будет сын Т’Чаллы

23

3
Райан Гослинг сыграет Призрачного гонщика в новом фильме Marvel

20

5
Baldur’s Gate 3 получила полноценную камеру из-за плеча благодаря моду

39
Трейлер 14 сезона «Футурамы» — премьера 3 августа

27
Новый трейлер Grand Theft Auto 6 покажут 6 августа, считает Том Хендерсон

43

1
Джордж Мартин отложил «Ветра зимы» ради новой истории о Дунке и Эгге

42

5
Кто все эти люди: число ведьм в «Мстители: Судный день» утроилось

34
СМИ: OpenAI неделю не замечала «побег» ИИ-агента, взломавшего Hugging Face

29
СМИ: SpaceX начала отказывать в запусках Falcon 9 после 2028 года ради перехода на Starship

21
Полежать, отдохнуть: ученые выяснили, зачем самки китов переворачиваются брюхом вверх

33
Экстракшен-фентези: геймплейный трейлер Mistfall Hunter

35
Фото: демонстратор истребителя 6 поколения Tempest

30

2
Закон об экстренном отключении опасных ИИ-моделей разработали в США

26
Midjourney купил астрологическое приложение Co-Star и назначил его основательницу директором по дизайну

28

Полезные ссылки

Китай 18.09.2025 в 19:27

DeepSeek: модель R1 была обучена за 80 часов и $294 тысячи

Для обучения использовались ускорители Nvidia H800.

Китайский стартап DeepSeek опубликовал статью, посвященную созданию рассуждающей модели R1. В компании утверждают, что обучение модели заняло всего 80 часов и обошлось примерно в $294 тысячи.

Для обучения использовался кластер из 512 ускорителей Nvidia H800. Эти устройства созданы Nvidia специально для китайского рынка и удовлетворяют ограничениям, наложенным властями США.

Если данные DeepSeek верны, то компания обучает свои нейросети гораздо дешевле, чем конкуренты. Например, глава OpenAI Сэм Альтман рассказывал, что обучение моделей может обходиться в более чем $100 миллионов.

Возможно, в DeepSeek просто раскрыли статистику финального этапа обучения R1 — без учета всех предыдущих проб и ошибок. В этом случае реальная стоимость обучения модели должна быть заметно выше.

Модель R1 от DeepSeek выложена в открытый доступ, ее могут использовать все желающие — в том числе и американские компании.

Metro 2039 запретят в России?

Обязательно, еще до релиза

326 голосов, 26.1%

Обязательно, но после релиза

422 голоса, 33.8%

Может быть, но это не точно

225 голосов, 18.0%

Ну нет, это же обычная игра

275 голосов, 22.0%

Теги: Китай, Технологии

Evernews

8090 подписчиков

Подписаться на автора

Подписывайтесь на WTFTime в Google.Новости