Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

Большую языковую модель запустили на ПК 25-летней давности

3
0
Поделиться
Телеграфировать

Формально ее можно назвать не очень-то большой моделью.

Большую языковую модель запустили на ПК 25-летней давности

Принято считать, что современные большие языковые модели — например, GPT от OpenAI — требуют для работы чрезвычайно мощное железо, но это не совсем так. Современную модель можно запустить и на очень старой системе.

Это продемонстрировала команда EXO Labs, запустившая модель stories на ПК 25-летней давности. В качестве хоста использовалась система с Windows 98, процессором Intel Pentium II и 128 мегабайтами памяти.

Чтобы нейросеть работала на такой системе, ей пришлось немного помочь. В частности, использовался легкий кастомный движок для инференса, написанный на чистом языке C. С компиляцией кода для старой системы возникли проблемы, но в итоге их удалось решить.

Большая языковая модель работала только на процессоре, GPU не использовался. Модель с 15 миллионами параметров выдавала на Pentium II 1 токен в секунду, модель с 260 тысячами параметров генерировала уже 39 токенов в секунду.

Энтузиасты полагают, что относительно современная модель Llama 3.2 1B* выдавала бы на такой системе порядка 0.0093 токена в секунду, то есть одного слова в ответ пришлось бы ждать порядка трех минут. Современные системы справляются с обсчетом нейросетей гораздо быстрее.

Исходники адаптированного движка для инференса, предназначенного для запуска моделей Llama на старом железе и Windows 98, выложены в открытый доступ.

Читать далее
Как вам S.T.A.L.K.E.R. 2?
Отличная игра
1435 голосов, 36.8%
Хорошо, но могло быть лучше
700 голосов, 17.9%
Самая обычная игра
267 голосов, 6.8%
Ужасно, пожалел о покупке/скачивании
348 голосов, 8.9%
Не играл и не собираюсь
1152 голоса, 29.5%
Теги: Технологии
Аватар Evernews
Evernews
8068 подписчиков