Все новости
Это интересно
Сейчас читают
Китай
Аватар Evernews Evernews

СМИ: DeepSeek не смогла обучить новую модель на ускорителях Huawei

0
0
Поделиться
Телеграфировать

Такое обучение якобы проводилось по рекомендации властей Китая.

СМИ: DeepSeek не смогла обучить новую модель на ускорителях Huawei

Китайский стартап DeepSeek отложил релиз большой языковой модели R2 из-за проблем с ее обучением на отечественных чипах, утверждают источники Financial Times. Обучение нейросети якобы проводилось на Huawei Ascend.

По словам источников, DeepSeek перешла с ускорителей Nvidia на решения Huawei с подачи властей Китая. В ходе обучения на Ascend инженеры якобы столкнулись с техническими проблемами:от нестабильной работы до ограниченной скорости обмена данными между чипами.

Huawei якобы направила на помощь DeepSeek своих специалистов для адаптации Ascend под задачи стартапа, но провести успешный цикл обучения так и не удалось.

Из-за этого, утверждает издание, модель DeepSeek R2 пришлось обучать заново, уже на ускорителях Nvidia. Устройства Huawei якобы решили оставить только для запуска запросов к готовой модели.

По данным китайских изданий, презентация модели DeepSeek R2 запланирована на ближайшие недели. Вероятно, эта модель, как и предыдущие разработки DeepSeek, будет выложена в открытый доступ.

Читать далее
За сколько вы готовы купить GTA VI?
До 8000 рублей
2225 голосов, 7.3%
До 7000 рублей
828 голосов, 2.7%
До 6000 рублей
1012 голосов, 3.3%
До 5000 рублей
2698 голосов, 8.9%
До 4000 рублей
1074 голоса, 3.5%
До 3000 рублей
1445 голосов, 4.7%
До 2000 рублей
3445 голосов, 11.3%
За любые деньги
1710 голосов, 5.6%
Ни за сколько, я пират
15997 голосов, 52.6%
Теги: Китай, Технологии
Аватар Evernews
Evernews
8091 подписчик