Midjourney V6 испытали на фотореализм, вот что вышло
Указатели и некоторые мелкие детали все еще выдают нейросеть.
Кстати, на сайте читать удобнее
Шестая версия нейросети Midjourney, вышедшая в виде альфа-версии в конце 2023 года, умеет очень качественно имитировать кадры из фильмов: их не так-то легко отличить от оригиналов. Оказалось, с имитацией реальности у Midjourney V6 тоже все неплохо.
Чтобы проверить возможности обновленной нейросети, реддитор KudzuEye попросил Midjourney V6 сгенерировать ряд фотографий с обычными сценами из жизни: свадьбой, прогулкой, обедом в ресторане и так далее. В большинстве случаев получившиеся кадры выглядели очень правдоподобно.
Все запросы, подчеркивает экспериментатор, были очень простыми: задавалось самое общее описание сцены и соотношение сторон. Вот характерный пример.
phone photo of a man sitting on a bench with his family at a wedding in New York posted to reddit in 2019, --style raw ---s 0 --ar 9:16
Хотя при беглом взгляде созданные нейросетью фотографии выглядят очень хорошо, мелкие огрехи все еще есть. Midjourney V6 стала лучше справляться с генерацией текста, но когда нейросеть добавляет его куда-нибудь на фон, то надписи обычно совершенно нечитаемые.
Кроме того, ИИ все еще не вполне разбирается в человеческой анатомии. У героев одной из сгенерированных фотографий, например, очень странная пятка; на другом сгенерированном изображении у человека, похоже, одинаковые ноги.
Впрочем, нейросети-генераторы продолжают очень быстро развиваться и есть вероятность, что уже через полгода условная Midjourney V8 разберется и с ногами, и с текстами. Для сравнения: вот такие изображения Midjourney генерировала около года назад.