Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

DeepSeek выпустила генератор изображений Janus-Pro, конкурирующий с DALL-E и Stable Diffusion

0
0
Поделиться
Телеграфировать

Модель снова распространяется бесплатно.

DeepSeek выпустила генератор изображений Janus-Pro, конкурирующий с DALL-E и Stable Diffusion

Китайская компания DeepSeek, развивающая одноименное семейство больших языковых моделей, выпустила модель Janus-Pro, специализирующуюся на работе с изображениями. Janus-Pro — это мультимодальная модель, она умеет как анализировать изображения, так и создавать новые.

В DeepSeek утверждают, что благодаря разделению визуального кодирования на несколько путей модель работает лучше аналогов. При этом в основе Janus-Pro все еще лежит архитектура трансформера, общая для большинства современных моделей.

В тестах, проведенных самой DeepSeek, новая модель превосходит Stable Diffusion XL, DALL-E 3 и некоторые другие популярные модели. Сейчас опубликовано две версии Janus-Pro: урезанная модель с 1 миллиардом параметров и полная версия с 7 миллиардами параметров.

Janus-Pro создана на базе модели Janus, предыдущей разработки DeepSeek. Компания расширила набор данных, использовавшихся для обучения модели, и одновременно оптимизировала стратегию обучения.

Благодаря всем оптимизациям новая модель лучше следует промптам при генерации изображений и стабильнее генерирует текст в самих изображениях. Обе версии Janus-Pro выложены в открытый доступ.

Загрузить исходники новых моделей можно здесь, веса Janus-Pro опубликованы здесь и здесь.

Читать далее
За сколько вы готовы купить GTA VI?
До 8000 рублей
1983 голоса, 7.2%
До 7000 рублей
747 голосов, 2.7%
До 6000 рублей
908 голосов, 3.3%
До 5000 рублей
2420 голосов, 8.8%
До 4000 рублей
961 голос, 3.5%
До 3000 рублей
1303 голоса, 4.7%
До 2000 рублей
3110 голосов, 11.3%
За любые деньги
1530 голосов, 5.6%
Ни за сколько, я пират
14594 голоса, 53.0%
Теги: Технологии
Аватар Evernews
Evernews
8088 подписчиков