Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

Нейросеть «запекли» в чип без внешней памяти — инференс в 48 раз быстрее Nvidia B200

5
0
Поделиться
Телеграфировать

Кое-какие возможности для кастомизации все-таки остались.

Нейросеть «запекли» в чип без внешней памяти — инференс в 48 раз быстрее Nvidia B200

Стартап Taalas предложил новый подход к ускорению инференса нейросетей. Компания показала ускоритель Taalas HC1, чип которого представляет собой «запеченную» нейросеть вместе с весами.

Ускоритель не нуждается в десятках гигабайт внешней памяти и может очень быстро обрабатывать запросы. Тестовая версия HC1, использующая модель Llama 3.1 8B, выдает 16960 токенов в секунду — в 10 раз больше, чем система на базе Cerabras, и в 48 раз больше, чем Nvidia B200.

Есть ограничение: конкретный чип может работать только с конкретной нейросетью, HC1 не может запустить другую версию Llama или какой-то иной модели. Для этого придется проектировать отдельный чип.

Для тюнинга модели инженеры Taalas оставили возможность менять размер контекстного окна. Кроме того, поддерживаются LoRA-адаптеры, позволяющие тонко настраивать выдачу нейросети.

По оценке компании, производство ее ускорителя обходится примерно в 20 раз дешевле производства «современных аналогов», а энергопотребление во время инференса примерно в 10 раз меньше.

В конце 2026 года Taalas намерена выпустить ускоритель на втором поколении своего чипа. На этот раз в чипе «запекут» фронтир-модель, компания не говорит, о какой именно нейросети идет речь.

Читать далее
За сколько вы готовы купить GTA VI?
До 8000 рублей
2071 голос, 7.2%
До 7000 рублей
790 голосов, 2.8%
До 6000 рублей
948 голосов, 3.3%
До 5000 рублей
2530 голосов, 8.8%
До 4000 рублей
1008 голосов, 3.5%
До 3000 рублей
1354 голоса, 4.7%
До 2000 рублей
3212 голосов, 11.2%
За любые деньги
1596 голосов, 5.6%
Ни за сколько, я пират
15079 голосов, 52.7%
Теги: Технологии
Аватар Evernews
Evernews
8089 подписчиков