Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

Слух: на подходе модель DeepSeek R2 с 1.2 триллиона параметров

0
0
Поделиться
Телеграфировать

Предполагается, что новую модель снова обучили достаточно дешево.

Слух: на подходе модель DeepSeek R2 с 1.2 триллиона параметров

Китайский стартап DeepSeek готовит к запуску рассуждающую модель R2, пишет South China Morning Post со ссылкой на китайские источники. Релиз модели якобы состоится в ближайшее время.

Утверждается, что DeepSeek R2 — это модель с 1.2 триллиона параметров. Инженеры DeepSeek якобы использовали гибридную архитектуру с применением экспертов, отдельных нейросетей, обрабатывающих фрагменты входящих данных.

Похожим образом устроена модель Llama 4 от Meta*. Топовая версия Llama 4 получила 16 экспертов и 2 триллиона параметров, но активных параметров лишь 288 миллиардов.

По словам китайских источников, DeepSeek R2 удалось обучить очень дешево — модель якобы на 97.3% дешевле GPT-4o от OpenAI. Утверждается, что DeepSeek R2 задаст «новые стандарты экономической эффективности и производительности».

Предыдущая рассуждающая модель стартапа, R1, была выпущена в январе 2025 года. Интерес к модели оказался так велик, что стоимость американских компаний, связанных с ИИ, заметно просела.

* Компания Meta признана в России экстремистской организацией.

Читать далее
За сколько вы готовы купить GTA VI?
До 8000 рублей
424 голоса, 5.9%
До 7000 рублей
130 голосов, 1.8%
До 6000 рублей
174 голоса, 2.4%
До 5000 рублей
711 голосов, 10.0%
До 4000 рублей
194 голоса, 2.7%
До 3000 рублей
333 голоса, 4.7%
До 2000 рублей
807 голосов, 11.3%
За любые деньги
401 голос, 5.6%
Ни за сколько, я пират
3969 голосов, 55.6%
Теги: Технологии
Аватар Evernews
Evernews
8074 подписчика