Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

Большую языковую модель запустили на ПК 25-летней давности

4
0
Поделиться
Телеграфировать

Формально ее можно назвать не очень-то большой моделью.

Большую языковую модель запустили на ПК 25-летней давности

Принято считать, что современные большие языковые модели — например, GPT от OpenAI — требуют для работы чрезвычайно мощное железо, но это не совсем так. Современную модель можно запустить и на очень старой системе.

Это продемонстрировала команда EXO Labs, запустившая модель stories на ПК 25-летней давности. В качестве хоста использовалась система с Windows 98, процессором Intel Pentium II и 128 мегабайтами памяти.

Чтобы нейросеть работала на такой системе, ей пришлось немного помочь. В частности, использовался легкий кастомный движок для инференса, написанный на чистом языке C. С компиляцией кода для старой системы возникли проблемы, но в итоге их удалось решить.

Большая языковая модель работала только на процессоре, GPU не использовался. Модель с 15 миллионами параметров выдавала на Pentium II 1 токен в секунду, модель с 260 тысячами параметров генерировала уже 39 токенов в секунду.

Энтузиасты полагают, что относительно современная модель Llama 3.2 1B* выдавала бы на такой системе порядка 0.0093 токена в секунду, то есть одного слова в ответ пришлось бы ждать порядка трех минут. Современные системы справляются с обсчетом нейросетей гораздо быстрее.

Исходники адаптированного движка для инференса, предназначенного для запуска моделей Llama на старом железе и Windows 98, выложены в открытый доступ.

Читать далее
Как вам Kingdom Come Deliverance 2?
Кандидат на «Игру года»
3311 голосов, 61.2%
Хорошо, но могло быть лучше
359 голосов, 6.6%
Самая обычная игра
223 голоса, 4.1%
Ужасно, пожалел о покупке/скачивании
249 голосов, 4.6%
Не играл и не собираюсь
1264 голоса, 23.4%
Теги: Технологии
Аватар Evernews
Evernews
8072 подписчика