Все новости
Это интересно
Сейчас читают
Nvidia
Аватар Evernews Evernews

Nvidia показала неплохую генерацию видео по текстовому описанию

1
0
Поделиться
Телеграфировать

Кажется, по сравнению с конкурентами глюков стало меньше.

Nvidia показала неплохую генерацию видео по текстовому описанию

Исследователи из Nvidia Toronto AI Lab рассказали о технологии VideoLDM, позволяющей генерировать видеоролики по текстовому описанию. В основе VideoLDM лежит нейросеть, использующая принцип латентной диффузии.

Ролики, показанные Nvidia, длятся около 3 секунд и сгенерированы в разрешении 2048x1280 при 24 кадрах в секунду. Видео генерировались нейросетью с 2.7 миллиарда параметров.

Как объясняют в компании, это очень скромный показатель: нейросети-конкуренты гораздо массивнее. В то же время VideoLDM генерирует ролики, по качеству сопоставимые или превосходящие работы конкурирующих технологий.

Сотрудники Nvidia Toronto AI Lab опубликовали научную работу, описывающую принципы работы VideoLDM, но не стали выкладывать исходники технологии в открытый доступ.

Читать далее
За сколько вы готовы купить GTA VI?
До 8000 рублей
1438 голосов, 7.1%
До 7000 рублей
490 голосов, 2.4%
До 6000 рублей
636 голосов, 3.1%
До 5000 рублей
1832 голоса, 9.0%
До 4000 рублей
693 голоса, 3.4%
До 3000 рублей
957 голосов, 4.7%
До 2000 рублей
2299 голосов, 11.3%
За любые деньги
1088 голосов, 5.4%
Ни за сколько, я пират
10865 голосов, 53.5%
Теги: Nvidia, Технологии
Аватар Evernews
Evernews
8086 подписчиков