Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

Самый мощный суперкомпьютер испытали в обучении языковой модели на триллион параметров

1
0
Поделиться
Телеграфировать

Основной проблемой стало параллельное использование ресурсов.

Самый мощный суперкомпьютер испытали в обучении языковой модели на триллион параметров

Исследователи из Национальной лаборатории Ок-Ридж использовали Frontier, самый быстрый суперкомпьютер в мире, для обучения большой языковой модели. В рамках эксперимента на Frontier обучили модель с триллионом параметров, это уровень актуальной версии ChatGPT.

Суперкомпьютер Frontier обладает производительностью в 1.19 экзафлопс, но для обучения ИИ использовали только 8% ускорителей, входящих в состав устройства. Как объясняют ученые, основной проблемой была не вычислительная мощность, а память.

Для обучения языковой модели с триллионом параметров требовалось минимум 14 терабайт памяти. Ее было более чем достаточно: суперкомпьютер Frontier состоит из 37888 ускорителей Radeon Instinct, каждый из которых оснащен 64 гигабайтами памяти.

Однако, отмечают ученые, возникла проблема: требовалось сделать так, чтобы множество ускорителей могли распределенно решать одну и ту же задачу, не тратя ресурсы на дублирование вычислений.

В итоге исследователям удалось добиться эффективности масштабирования в 87% для модели с триллионом параметров и 89% для модели со 175 миллиардами параметров.

Такая эффективность означает, что при желании суперкомпьютер можно целиком нагрузить обучением языковой модели и «накладные расходы» на обучение окажутся не слишком велики.

Читать далее
Собираетесь проходить S.T.A.L.K.E.R. 2?
Обязательно, куплю или уже купил
169 голосов, 14.1%
Играть буду, но спирачу
605 голосов, 50.3%
Когда-нибудь куплю по скидке
82 голоса, 6.8%
Нет, никогда
346 голосов, 28.8%
Теги: Технологии
Аватар Evernews
Evernews
8067 подписчиков