Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

Большую языковую модель запустили на ПК 25-летней давности

4
0
Поделиться
Телеграфировать

Формально ее можно назвать не очень-то большой моделью.

Большую языковую модель запустили на ПК 25-летней давности

Принято считать, что современные большие языковые модели — например, GPT от OpenAI — требуют для работы чрезвычайно мощное железо, но это не совсем так. Современную модель можно запустить и на очень старой системе.

Это продемонстрировала команда EXO Labs, запустившая модель stories на ПК 25-летней давности. В качестве хоста использовалась система с Windows 98, процессором Intel Pentium II и 128 мегабайтами памяти.

Чтобы нейросеть работала на такой системе, ей пришлось немного помочь. В частности, использовался легкий кастомный движок для инференса, написанный на чистом языке C. С компиляцией кода для старой системы возникли проблемы, но в итоге их удалось решить.

Большая языковая модель работала только на процессоре, GPU не использовался. Модель с 15 миллионами параметров выдавала на Pentium II 1 токен в секунду, модель с 260 тысячами параметров генерировала уже 39 токенов в секунду.

Энтузиасты полагают, что относительно современная модель Llama 3.2 1B* выдавала бы на такой системе порядка 0.0093 токена в секунду, то есть одного слова в ответ пришлось бы ждать порядка трех минут. Современные системы справляются с обсчетом нейросетей гораздо быстрее.

Исходники адаптированного движка для инференса, предназначенного для запуска моделей Llama на старом железе и Windows 98, выложены в открытый доступ.

Читать далее
Показали The Witcher 4 — что думаете?
Жду, выглядит интересно
1839 голосов, 62.9%
Трейлер не очень, подожду геймплей
230 голосов, 7.9%
Цири — ведьмачка? Да ну, это шутка
369 голосов, 12.6%
Больше не доверяю CD Projekt, пусть сначала выйдет
484 голоса, 16.6%
Теги: Технологии
Аватар Evernews
Evernews
8068 подписчиков