Baldur’s Gate 3 получила полноценную камеру из-за плеча благодаря моду

33
Популярные игры

Assassin's Creed Black Flag Resynced

Gothic 1 Remake

Subnautica 2

Windrose

Resident Evil Requiem

The Outer Worlds 2

Hollow Knight: Silksong

Silent Hill f

Zenless Zone Zero

Mafia The Old Country

еще 5 популярных страниц
Трейлер 14 сезона «Футурамы» — премьера 3 августа

25
Новый трейлер Grand Theft Auto 6 покажут 6 августа, считает Том Хендерсон

40
Джордж Мартин отложил «Ветра зимы» ради новой истории о Дунке и Эгге

40

5
Кто все эти люди: число ведьм в «Мстители: Судный день» утроилось

32
СМИ: OpenAI неделю не замечала «побег» ИИ-агента, взломавшего Hugging Face

26
СМИ: SpaceX начала отказывать в запусках Falcon 9 после 2028 года ради перехода на Starship

20
Полежать, отдохнуть: ученые выяснили, зачем самки китов переворачиваются брюхом вверх

31
Экстракшен-фентези: геймплейный трейлер Mistfall Hunter

34
Фото: демонстратор истребителя 6 поколения Tempest

29

2
Закон об экстренном отключении опасных ИИ-моделей разработали в США

25
Midjourney купил астрологическое приложение Co-Star и назначил его основательницу директором по дизайну

27
В 3 сезоне «Властелин колец: Колец власти» раскроют личность Темного волшебника

28
Прогноз магнитных бурь на 26 июля: рядом корональный выброс массы

27
В прошлом человечество могло говорить на десятках тысяч языков — исследование

34
Пожар у комплекса NASA в Испании угрожает связи с «Вояджерами» и другими зондами

20
Denuvo полноценно взломана в The First Berserker Khazan

23

1
Этот маневр будет стоить сотни миллионов: Paramount заморозила слияние с Warner Bros. Discovery почти на год

29
Трансформируйся: новый трейлер «Фонарей»

25
Starship слетала и вернулась: итоги 13 запуска

23

Полезные ссылки

Технологии 07.01.2024 в 16:14

Самый мощный суперкомпьютер испытали в обучении языковой модели на триллион параметров

Основной проблемой стало параллельное использование ресурсов.

Исследователи из Национальной лаборатории Ок-Ридж использовали Frontier, самый быстрый суперкомпьютер в мире, для обучения большой языковой модели. В рамках эксперимента на Frontier обучили модель с триллионом параметров, это уровень актуальной версии ChatGPT.

Суперкомпьютер Frontier обладает производительностью в 1.19 экзафлопс, но для обучения ИИ использовали только 8% ускорителей, входящих в состав устройства. Как объясняют ученые, основной проблемой была не вычислительная мощность, а память.

Для обучения языковой модели с триллионом параметров требовалось минимум 14 терабайт памяти. Ее было более чем достаточно: суперкомпьютер Frontier состоит из 37888 ускорителей Radeon Instinct, каждый из которых оснащен 64 гигабайтами памяти.

Однако, отмечают ученые, возникла проблема: требовалось сделать так, чтобы множество ускорителей могли распределенно решать одну и ту же задачу, не тратя ресурсы на дублирование вычислений.

В итоге исследователям удалось добиться эффективности масштабирования в 87% для модели с триллионом параметров и 89% для модели со 175 миллиардами параметров.

Такая эффективность означает, что при желании суперкомпьютер можно целиком нагрузить обучением языковой модели и «накладные расходы» на обучение окажутся не слишком велики.

Как думаете, когда выйдет The Elder Scrolls VI?

В 2027 году

221 голос, 16.7%

В 2028 году

364 голоса, 27.5%

В 2029 году

203 голоса, 15.3%

Да ладно, никогда

538 голосов, 40.6%

Теги: Технологии

Evernews

8090 подписчиков

Подписаться на автора

Подписывайтесь на WTFTime в Telegram