Слух: Nvidia готовит ускоритель специально для инференса ИИ
Предполагается, что для ИИ используют наработки Groq.
Nvidia намерена отказаться от использования универсальной архитектуры, общей для игровых видеокарт и ИИ-ускорителей, утверждают источники. Компания якобы готовит отдельный ускоритель на базе другой архитектуры.
Предполагается, что новое решение Nvidia будет предназначено для инференса — запуска уже обученных нейросетей. Архитектура якобы построена на решениях стартапа Groq, фактически поглощенного Nvidia.
Groq занимался как раз специализированными ускорителями Language Processing Units, предназначенными для инференса. После поглощения стартапа Nvidia не рассказывала об интеграции его наработок в существующие продукты.
Если верить источникам, новый ускоритель будет работать совместно с решениями на базе архитектуры следующего поколения Vera Rubin. Ожидается, что такая комбинация станет основой новой платформы Nvidia для ИИ-датацентров.
Анонс ускорителя может состояться на конференции Nvidia GTC, в 2026 году она пройдет 16-19 марта.
- СМИ: Nvidia почти целиком зависит от поставок из Азии — за год ситуация сильно ухудшилась
- Nvidia придумала, как в несколько раз ускорить трассировку пути
- Авторы Persona пообещали поменьше заставлять перерабатывать и приподнять зарплаты
- ИИ и невнимательный офицер отправили бабушку в тюрьму на 108 дней
- Nvidia показала локальную генерацию 4K-видео
- Как ИИ-бум начался с двух GeForce GTX 580: вспоминает глава Nvidia

