Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

DeepSeek выпустила генератор изображений Janus-Pro, конкурирующий с DALL-E и Stable Diffusion

0
0
Поделиться
Телеграфировать

Модель снова распространяется бесплатно.

DeepSeek выпустила генератор изображений Janus-Pro, конкурирующий с DALL-E и Stable Diffusion

Китайская компания DeepSeek, развивающая одноименное семейство больших языковых моделей, выпустила модель Janus-Pro, специализирующуюся на работе с изображениями. Janus-Pro — это мультимодальная модель, она умеет как анализировать изображения, так и создавать новые.

В DeepSeek утверждают, что благодаря разделению визуального кодирования на несколько путей модель работает лучше аналогов. При этом в основе Janus-Pro все еще лежит архитектура трансформера, общая для большинства современных моделей.

В тестах, проведенных самой DeepSeek, новая модель превосходит Stable Diffusion XL, DALL-E 3 и некоторые другие популярные модели. Сейчас опубликовано две версии Janus-Pro: урезанная модель с 1 миллиардом параметров и полная версия с 7 миллиардами параметров.

Janus-Pro создана на базе модели Janus, предыдущей разработки DeepSeek. Компания расширила набор данных, использовавшихся для обучения модели, и одновременно оптимизировала стратегию обучения.

Благодаря всем оптимизациям новая модель лучше следует промптам при генерации изображений и стабильнее генерирует текст в самих изображениях. Обе версии Janus-Pro выложены в открытый доступ.

Загрузить исходники новых моделей можно здесь, веса Janus-Pro опубликованы здесь и здесь.

Читать далее
Сколько вы тратите на игры за год?
Больше 100000 рублей
388 голосов, 5.8%
От 50000 до 100000 рублей
245 голосов, 3.6%
От 25000 до 50000 рублей
284 голоса, 4.2%
От 10000 до 25000 рублей
554 голоса, 8.2%
До 10000 рублей
1317 голосов, 19.6%
Нисколько, я пират. Йо-хо-хо!
3936 голосов, 58.5%
Теги: Технологии
Аватар Evernews
Evernews
8074 подписчика