Baldur’s Gate 3 получила полноценную камеру из-за плеча благодаря моду

33
Популярные игры

Assassin's Creed Black Flag Resynced

Gothic 1 Remake

Subnautica 2

Windrose

Resident Evil Requiem

The Outer Worlds 2

Hollow Knight: Silksong

Silent Hill f

Zenless Zone Zero

Mafia The Old Country

еще 5 популярных страниц
Трейлер 14 сезона «Футурамы» — премьера 3 августа

25
Новый трейлер Grand Theft Auto 6 покажут 6 августа, считает Том Хендерсон

40
Джордж Мартин отложил «Ветра зимы» ради новой истории о Дунке и Эгге

40

5
Кто все эти люди: число ведьм в «Мстители: Судный день» утроилось

32
СМИ: OpenAI неделю не замечала «побег» ИИ-агента, взломавшего Hugging Face

26
СМИ: SpaceX начала отказывать в запусках Falcon 9 после 2028 года ради перехода на Starship

20
Полежать, отдохнуть: ученые выяснили, зачем самки китов переворачиваются брюхом вверх

31
Экстракшен-фентези: геймплейный трейлер Mistfall Hunter

34
Фото: демонстратор истребителя 6 поколения Tempest

29

2
Закон об экстренном отключении опасных ИИ-моделей разработали в США

25
Midjourney купил астрологическое приложение Co-Star и назначил его основательницу директором по дизайну

27
В 3 сезоне «Властелин колец: Колец власти» раскроют личность Темного волшебника

28
Прогноз магнитных бурь на 26 июля: рядом корональный выброс массы

27
В прошлом человечество могло говорить на десятках тысяч языков — исследование

34
Пожар у комплекса NASA в Испании угрожает связи с «Вояджерами» и другими зондами

20
Denuvo полноценно взломана в The First Berserker Khazan

23

1
Этот маневр будет стоить сотни миллионов: Paramount заморозила слияние с Warner Bros. Discovery почти на год

29
Трансформируйся: новый трейлер «Фонарей»

25
Starship слетала и вернулась: итоги 13 запуска

23

Полезные ссылки

Технологии 28.04.2025 в 17:01

Слух: на подходе модель DeepSeek R2 с 1.2 триллиона параметров

Предполагается, что новую модель снова обучили достаточно дешево.

Китайский стартап DeepSeek готовит к запуску рассуждающую модель R2, пишет South China Morning Post со ссылкой на китайские источники. Релиз модели якобы состоится в ближайшее время.

Утверждается, что DeepSeek R2 — это модель с 1.2 триллиона параметров. Инженеры DeepSeek якобы использовали гибридную архитектуру с применением экспертов, отдельных нейросетей, обрабатывающих фрагменты входящих данных.

Похожим образом устроена модель Llama 4 от Meta*. Топовая версия Llama 4 получила 16 экспертов и 2 триллиона параметров, но активных параметров лишь 288 миллиардов.

По словам китайских источников, DeepSeek R2 удалось обучить очень дешево — модель якобы на 97.3% дешевле GPT-4o от OpenAI. Утверждается, что DeepSeek R2 задаст «новые стандарты экономической эффективности и производительности».

Предыдущая рассуждающая модель стартапа, R1, была выпущена в январе 2025 года. Интерес к модели оказался так велик, что стоимость американских компаний, связанных с ИИ, заметно просела.

* Компания Meta признана в России экстремистской организацией.

Metro 2039 запретят в России?

Обязательно, еще до релиза

326 голосов, 26.1%

Обязательно, но после релиза

421 голос, 33.8%

Может быть, но это не точно

225 голосов, 18.0%

Ну нет, это же обычная игра

275 голосов, 22.1%

Теги: Технологии

Evernews

8090 подписчиков

Подписаться на автора

Подписывайтесь на WTFTime в Google.Новости