Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

Работающая на процессорах нейросеть Microsoft смогла обойти традиционных конкурентов схожих размеров

0
0
Поделиться
Телеграфировать

При работе модель тратила всего 400 мегабайт памяти.

Работающая на процессорах нейросеть Microsoft смогла обойти традиционных конкурентов схожих размеров

Исследовательское подразделение корпорации Microsoft выпустило экспериментальную нейросеть BitNet b1.58 2B. Авторы называют свою разработку первой однобитной языковой моделью с открытыми исходниками; модель адаптирована для работы на обычных процессорах.

Обычно нейросети работают либо на GPU, либо на специальных ускорителях. Модель BitNet b1.58 2B, функционируя на процессорах, потребляет меньше памяти, чем конкуренты, и обходит их в некоторых бенчмарках.

Для работы BitNet b1.58 2B нужно всего 400 мегабайт памяти (LLama 3.2 с 1 миллиардом параметров нужно 2 гигабайта), при этом модель работает быстрее протестированных конкурентов. Кроме того, BitNet b1.58 2B оказалась гораздо энергоэффективнее соперников.

Модель была натренирована на 4 триллионах токенов контента, она получила 2 миллиарда параметров. Исследователи выложили в открытый доступ веса основной модели, а также связанные с ней исходники.

Важный момент: BitNet b1.58 2B работает на основе фреймворка BitNet, созданного Microsoft. Сейчас фреймворк не умеет работать с NPU и GPU, добавить их поддержку планируется в обозримом будущем.

В Microsoft называют BitNet b1.58 2B доказательством того, что однобитные модели могут на равных конкурировать с традиционными нейросетями, превосходя их в некоторых областях. Компания планирует продолжить исследования в этом направлении.

Читать далее
Как вам Kingdom Come Deliverance 2?
Кандидат на «Игру года»
7964 голоса, 49.0%
Хорошо, но могло быть лучше
1381 голос, 8.5%
Самая обычная игра
893 голоса, 5.5%
Ужасно, пожалел о покупке/скачивании
1062 голоса, 6.5%
Не играл и не собираюсь
4941 голос, 30.4%
Теги: Технологии
Аватар Evernews
Evernews
8084 подписчика