Представлена CAT3D, технология быстрой реконструкции 2D в 3D
Разумеется, у нее под капотом есть нейросети.
Кстати, на сайте читать удобнее
Группа исследователей из Google Research и Google DeepMind показала технологию CAT3D. Она предназначена для быстрой реконструкции трехмерных пространств на основе наборов изображений — весь процесс занимает около минуты.
Для построения трехмерной сцены CAT3D достаточно нескольких фотографий или артов, показывающих объект или сцену с разных ракурсов. Интересный момент: сцену не нужно демонстрировать со всех сторон.
CAT3D умеет правдоподобно восстанавливать фрагменты изображений, не попавшие в кадр — например, задние части объектов. Судя по демо-ролику, технология справится и с елочкой, и со скелетом, и с крокодилом.
В основе CAT3D лежит нейросеть Latent Diffusion, прошедшая специальную тренировку. Благодаря обучению модель может создавать изображения, описывающие сцену и сохраняющие консистентность.
На основе созданных изображений запускается дополнительное обучение системы нейронного рендеринга, выдающей трехмерную версию сцены. По оценке авторов проекта, CAT3D справляется с воссозданием трехмерных сцен заметно лучше конкурентов.
Посмотреть несколько демонстраций работы технологии можно здесь.
- СМИ: бывшим сотрудникам OpenAI пожизненно запрещено критиковать компанию под угрозой потери акций
- Первый полет Boeing Starliner с людьми на борту снова перенесли — теперь на 25 мая
- История Фуриосы: трейлер «Хроник Безумного Макса» о прошлом главной героини
- Международные организации и карты Пиренейского полуострова в Project Caesar
- Попробуйте набрать больше 8: игру Neuralink для обладателей имплантов выложили в открытый доступ
- Российские клиенты Microsoft начали лишаться доступа к сервисам компании