Все новости
Это интересно
Сейчас читают
Арт
Аватар Evernews Evernews

Вышла Stable Diffusion 2.0 — качество изображений должно стать выше, но пользователи в этом сомневаются

1
0
Поделиться
Телеграфировать

Нейросеть по-прежнему распространяется с открытым исходным кодом.

Вышла Stable Diffusion 2.0 — качество изображений должно стать выше, но пользователи в этом сомневаются

Компания Stability AI, занимающаяся развитием нейросети Stable Diffusion, объявила о выпуске Stable Diffusion 2.0. Нейросеть, генерирующая изображения по описаниям и редактирующая существующие арты, получила множество улучшений.

  • Появилась новая модель преобразования текста в изображение. В Stable Diffusion 2.0 используется новый текстовый кодировщик OpenCLIP от LAION и самой Stability AI, благодаря этому удалось «значительно увеличить» качество генерируемых изображений.
  • Модель обучена на датасете LAION-5B, чтобы избежать генерации взрослого контента, дополнительно использовался специальный фильтр.
  • По умолчанию Stable Diffusion 2.0 может генерировать изображения 512х512 и 768х768 пикселей.
  • Появилась модель Upscaler Diffusion, отвечающая за апскейл изображений.
  • Модель может повысить разрешение исходного кадра в 4 раза, благодаря ей Stable Diffusion 2.0 может генерировать изображения с разрешением вплоть до 2048х2048 пикселей.
  • Обновлена модель Inpainting Diffusion, позволяющая заменять фрагменты изображения.
  • Добавлена модель depth2img, позволяющая преобразовывать существующие изображения.
  • При генерации новых изображений модель может учитывать как текстовое описание, так и данные о «глубине» объектов на исходном кадре.

В Stability AI отмечают, что постарались оптимизировать Stable Diffusion 2.0 для работы на одном GPU — чтобы нейросеть была доступна как можно большему количеству пользователей. Исходники Stable Diffusion 2.0 все еще открыты, загрузить нейросеть можно здесь.

Участники сабреддита StableDiffusion сомневаются, что вторая версия нейросети это шаг вперед. На основе ранних тестов можно сделать вывод, что из датасета пропала часть данных: к примеру, теперь Stable Diffusion плохо представляет, как выглядит Эмма Уотсон, и не умеет работать в стиле некоторых художников.

Создатели нейросети пока не комментировали предположения пользователей.

Читать далее
За сколько вы готовы купить GTA VI?
До 8000 рублей
209 голосов, 5.2%
До 7000 рублей
63 голоса, 1.6%
До 6000 рублей
81 голос, 2.0%
До 5000 рублей
405 голосов, 10.2%
До 4000 рублей
104 голоса, 2.6%
До 3000 рублей
192 голоса, 4.8%
До 2000 рублей
481 голос, 12.1%
За любые деньги
219 голосов, 5.5%
Ни за сколько, я пират
2230 голосов, 56.0%
Теги: Арт, Технологии
Аватар Evernews
Evernews
8073 подписчика