Все новости
Это интересно
Сейчас читают
Nvidia
Аватар Evernews Evernews

Nvidia показала неплохую генерацию видео по текстовому описанию

1
0
Поделиться
Телеграфировать

Кажется, по сравнению с конкурентами глюков стало меньше.

Nvidia показала неплохую генерацию видео по текстовому описанию

Исследователи из Nvidia Toronto AI Lab рассказали о технологии VideoLDM, позволяющей генерировать видеоролики по текстовому описанию. В основе VideoLDM лежит нейросеть, использующая принцип латентной диффузии.

Ролики, показанные Nvidia, длятся около 3 секунд и сгенерированы в разрешении 2048x1280 при 24 кадрах в секунду. Видео генерировались нейросетью с 2.7 миллиарда параметров.

Как объясняют в компании, это очень скромный показатель: нейросети-конкуренты гораздо массивнее. В то же время VideoLDM генерирует ролики, по качеству сопоставимые или превосходящие работы конкурирующих технологий.

Сотрудники Nvidia Toronto AI Lab опубликовали научную работу, описывающую принципы работы VideoLDM, но не стали выкладывать исходники технологии в открытый доступ.

Читать далее
Сколько вы тратите на игры за год?
Больше 100000 рублей
450 голосов, 6.0%
От 50000 до 100000 рублей
282 голоса, 3.7%
От 25000 до 50000 рублей
343 голоса, 4.5%
От 10000 до 25000 рублей
626 голосов, 8.3%
До 10000 рублей
1463 голоса, 19.3%
Нисколько, я пират. Йо-хо-хо!
4399 голосов, 58.2%
Теги: Nvidia, Технологии
Аватар Evernews
Evernews
8074 подписчика