Все новости
Это интересно
Сейчас читают
Арт
Аватар Evernews Evernews

Вышла Stable Diffusion 2.0 — качество изображений должно стать выше, но пользователи в этом сомневаются

1
0
Поделиться
Телеграфировать

Нейросеть по-прежнему распространяется с открытым исходным кодом.

Вышла Stable Diffusion 2.0 — качество изображений должно стать выше, но пользователи в этом сомневаются

Компания Stability AI, занимающаяся развитием нейросети Stable Diffusion, объявила о выпуске Stable Diffusion 2.0. Нейросеть, генерирующая изображения по описаниям и редактирующая существующие арты, получила множество улучшений.

  • Появилась новая модель преобразования текста в изображение. В Stable Diffusion 2.0 используется новый текстовый кодировщик OpenCLIP от LAION и самой Stability AI, благодаря этому удалось «значительно увеличить» качество генерируемых изображений.
  • Модель обучена на датасете LAION-5B, чтобы избежать генерации взрослого контента, дополнительно использовался специальный фильтр.
  • По умолчанию Stable Diffusion 2.0 может генерировать изображения 512х512 и 768х768 пикселей.
  • Появилась модель Upscaler Diffusion, отвечающая за апскейл изображений.
  • Модель может повысить разрешение исходного кадра в 4 раза, благодаря ей Stable Diffusion 2.0 может генерировать изображения с разрешением вплоть до 2048х2048 пикселей.
  • Обновлена модель Inpainting Diffusion, позволяющая заменять фрагменты изображения.
  • Добавлена модель depth2img, позволяющая преобразовывать существующие изображения.
  • При генерации новых изображений модель может учитывать как текстовое описание, так и данные о «глубине» объектов на исходном кадре.

В Stability AI отмечают, что постарались оптимизировать Stable Diffusion 2.0 для работы на одном GPU — чтобы нейросеть была доступна как можно большему количеству пользователей. Исходники Stable Diffusion 2.0 все еще открыты, загрузить нейросеть можно здесь.

Участники сабреддита StableDiffusion сомневаются, что вторая версия нейросети это шаг вперед. На основе ранних тестов можно сделать вывод, что из датасета пропала часть данных: к примеру, теперь Stable Diffusion плохо представляет, как выглядит Эмма Уотсон, и не умеет работать в стиле некоторых художников.

Создатели нейросети пока не комментировали предположения пользователей.

Читать далее
За сколько вы готовы купить GTA VI?
До 8000 рублей
2161 голос, 7.3%
До 7000 рублей
816 голосов, 2.7%
До 6000 рублей
992 голоса, 3.3%
До 5000 рублей
2655 голосов, 8.9%
До 4000 рублей
1047 голосов, 3.5%
До 3000 рублей
1418 голосов, 4.8%
До 2000 рублей
3366 голосов, 11.3%
За любые деньги
1661 голос, 5.6%
Ни за сколько, я пират
15659 голосов, 52.6%
Теги: Арт, Технологии
Аватар Evernews
Evernews
8091 подписчик