Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

DeepSeek выпустила генератор изображений Janus-Pro, конкурирующий с DALL-E и Stable Diffusion

0
0
Поделиться
Телеграфировать

Модель снова распространяется бесплатно.

DeepSeek выпустила генератор изображений Janus-Pro, конкурирующий с DALL-E и Stable Diffusion

Китайская компания DeepSeek, развивающая одноименное семейство больших языковых моделей, выпустила модель Janus-Pro, специализирующуюся на работе с изображениями. Janus-Pro — это мультимодальная модель, она умеет как анализировать изображения, так и создавать новые.

В DeepSeek утверждают, что благодаря разделению визуального кодирования на несколько путей модель работает лучше аналогов. При этом в основе Janus-Pro все еще лежит архитектура трансформера, общая для большинства современных моделей.

В тестах, проведенных самой DeepSeek, новая модель превосходит Stable Diffusion XL, DALL-E 3 и некоторые другие популярные модели. Сейчас опубликовано две версии Janus-Pro: урезанная модель с 1 миллиардом параметров и полная версия с 7 миллиардами параметров.

Janus-Pro создана на базе модели Janus, предыдущей разработки DeepSeek. Компания расширила набор данных, использовавшихся для обучения модели, и одновременно оптимизировала стратегию обучения.

Благодаря всем оптимизациям новая модель лучше следует промптам при генерации изображений и стабильнее генерирует текст в самих изображениях. Обе версии Janus-Pro выложены в открытый доступ.

Загрузить исходники новых моделей можно здесь, веса Janus-Pro опубликованы здесь и здесь.

Читать далее
За сколько вы готовы купить GTA VI?
До 8000 рублей
97 голосов, 4.7%
До 7000 рублей
31 голос, 1.5%
До 6000 рублей
51 голос, 2.5%
До 5000 рублей
224 голоса, 10.9%
До 4000 рублей
65 голосов, 3.2%
До 3000 рублей
110 голосов, 5.3%
До 2000 рублей
270 голосов, 13.1%
За любые деньги
100 голосов, 4.8%
Ни за сколько, я пират
1114 голосов, 54.0%
Теги: Технологии
Аватар Evernews
Evernews
8072 подписчика