Все новости
Это интересно
Сейчас читают
Арт
Аватар Evernews Evernews

Вышла Stable Diffusion 2.0 — качество изображений должно стать выше, но пользователи в этом сомневаются

1
0
Поделиться
Телеграфировать

Нейросеть по-прежнему распространяется с открытым исходным кодом.

Вышла Stable Diffusion 2.0 — качество изображений должно стать выше, но пользователи в этом сомневаются

Компания Stability AI, занимающаяся развитием нейросети Stable Diffusion, объявила о выпуске Stable Diffusion 2.0. Нейросеть, генерирующая изображения по описаниям и редактирующая существующие арты, получила множество улучшений.

  • Появилась новая модель преобразования текста в изображение. В Stable Diffusion 2.0 используется новый текстовый кодировщик OpenCLIP от LAION и самой Stability AI, благодаря этому удалось «значительно увеличить» качество генерируемых изображений.
  • Модель обучена на датасете LAION-5B, чтобы избежать генерации взрослого контента, дополнительно использовался специальный фильтр.
  • По умолчанию Stable Diffusion 2.0 может генерировать изображения 512х512 и 768х768 пикселей.
  • Появилась модель Upscaler Diffusion, отвечающая за апскейл изображений.
  • Модель может повысить разрешение исходного кадра в 4 раза, благодаря ей Stable Diffusion 2.0 может генерировать изображения с разрешением вплоть до 2048х2048 пикселей.
  • Обновлена модель Inpainting Diffusion, позволяющая заменять фрагменты изображения.
  • Добавлена модель depth2img, позволяющая преобразовывать существующие изображения.
  • При генерации новых изображений модель может учитывать как текстовое описание, так и данные о «глубине» объектов на исходном кадре.

В Stability AI отмечают, что постарались оптимизировать Stable Diffusion 2.0 для работы на одном GPU — чтобы нейросеть была доступна как можно большему количеству пользователей. Исходники Stable Diffusion 2.0 все еще открыты, загрузить нейросеть можно здесь.

Участники сабреддита StableDiffusion сомневаются, что вторая версия нейросети это шаг вперед. На основе ранних тестов можно сделать вывод, что из датасета пропала часть данных: к примеру, теперь Stable Diffusion плохо представляет, как выглядит Эмма Уотсон, и не умеет работать в стиле некоторых художников.

Создатели нейросети пока не комментировали предположения пользователей.

Читать далее
Сколько вы тратите на игры за год?
Больше 100000 рублей
281 голос, 5.4%
От 50000 до 100000 рублей
182 голоса, 3.5%
От 25000 до 50000 рублей
203 голоса, 3.9%
От 10000 до 25000 рублей
423 голоса, 8.2%
До 10000 рублей
1032 голоса, 20.0%
Нисколько, я пират. Йо-хо-хо!
3043 голоса, 58.9%
Теги: Арт, Технологии
Аватар Evernews
Evernews
8074 подписчика