Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

OpenAI выпустила нейросеть, генерирующую и редактирующую реалистичные изображения по описанию

7
1
Поделиться
Телеграфировать

Экспериментировать с моделями лучше на видеокарте.

OpenAI выпустила нейросеть, генерирующую и редактирующую реалистичные изображения по описанию

Исследователи из OpenAI опубликовали научную работу, в которой описана нейросеть GLIDE. Ее задача: генерировать фотореалистичные изображения по текстовому описанию и редактировать их — тоже по описанию.

Нейросеть может распознавать более-менее естественный язык. В качестве примера исследователи приводят следующую последовательность команд: «уютная гостинная», «портрет корги на стене над диваном», «круглый кофейный столик перед диваном».

Первая команда генерирует изображение, последующие отвечают за ее редактирование. На изображении действительно появляются портрет и стол; правда, затем нейросеть без команды решает поменять расположение окон.

С реальными изображениями нейросеть тоже справляется. В показанных ниже примерах ИИ получает фотографию, а затем редактирует ее, руководствуясь простыми текстовыми указаниями на естественном языке.

GLIDE — не первая нейронная сеть, способная генерировать изображения по описанию, но в OpenAI уверены, что их разработка справляется с этой задачей лучше, чем конкурирующие ИИ. Вот сравнение двух версий GLIDE с DALL-E, XMC-GAN и реальными фотографиями.

Впрочем, нейросеть не всегда может выполнить поставленную задачу. С необычными запросами GLIDE справляется плохо: видимо, потому что на изображениях, по которым обучалась модель, не так уж много машин с треугольными колесами или мышей, охотящихся на львов.

Поэкспериментировать с нейросетью могут все желающие. Исследователи выложили в открытый доступ исходники и модель с 300 миллионами параметров. Все изображения в этом тексте сгенерировала модель с 3.5 миллиарда параметров.

Правда, эксперименты стоит проводить на видеокарте. Генерирование изображение на CPU, подсчитали энтузиасты, может заниматься порядка 20 минут, а видеокарта справляется примерно за минуту.

Читать далее
За сколько вы готовы купить GTA VI?
До 8000 рублей
2155 голосов, 7.3%
До 7000 рублей
814 голосов, 2.7%
До 6000 рублей
992 голоса, 3.3%
До 5000 рублей
2649 голосов, 8.9%
До 4000 рублей
1045 голосов, 3.5%
До 3000 рублей
1415 голосов, 4.8%
До 2000 рублей
3355 голосов, 11.3%
За любые деньги
1657 голосов, 5.6%
Ни за сколько, я пират
15621 голос, 52.6%
Теги: Технологии
Аватар Evernews
Evernews
8091 подписчик