Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

DeepSeek выпустила генератор изображений Janus-Pro, конкурирующий с DALL-E и Stable Diffusion

0
0
Поделиться
Телеграфировать

Модель снова распространяется бесплатно.

DeepSeek выпустила генератор изображений Janus-Pro, конкурирующий с DALL-E и Stable Diffusion

Китайская компания DeepSeek, развивающая одноименное семейство больших языковых моделей, выпустила модель Janus-Pro, специализирующуюся на работе с изображениями. Janus-Pro — это мультимодальная модель, она умеет как анализировать изображения, так и создавать новые.

В DeepSeek утверждают, что благодаря разделению визуального кодирования на несколько путей модель работает лучше аналогов. При этом в основе Janus-Pro все еще лежит архитектура трансформера, общая для большинства современных моделей.

В тестах, проведенных самой DeepSeek, новая модель превосходит Stable Diffusion XL, DALL-E 3 и некоторые другие популярные модели. Сейчас опубликовано две версии Janus-Pro: урезанная модель с 1 миллиардом параметров и полная версия с 7 миллиардами параметров.

Janus-Pro создана на базе модели Janus, предыдущей разработки DeepSeek. Компания расширила набор данных, использовавшихся для обучения модели, и одновременно оптимизировала стратегию обучения.

Благодаря всем оптимизациям новая модель лучше следует промптам при генерации изображений и стабильнее генерирует текст в самих изображениях. Обе версии Janus-Pro выложены в открытый доступ.

Загрузить исходники новых моделей можно здесь, веса Janus-Pro опубликованы здесь и здесь.

Читать далее
За сколько вы готовы купить GTA VI?
До 8000 рублей
1075 голосов, 6.8%
До 7000 рублей
368 голосов, 2.3%
До 6000 рублей
476 голосов, 3.0%
До 5000 рублей
1461 голос, 9.3%
До 4000 рублей
503 голоса, 3.2%
До 3000 рублей
743 голоса, 4.7%
До 2000 рублей
1800 голосов, 11.4%
За любые деньги
860 голосов, 5.4%
Ни за сколько, я пират
8506 голосов, 53.9%
Теги: Технологии
Аватар Evernews
Evernews
8080 подписчиков