Представлена нейросеть YandexART (Vi) для создания пятисекундных видео

ЖМИ! ДРУЖИ! ОБЩАЙСЯ!

Ранее Яндекс уже представил модель для генерации видео по текстовым запросам, однако прежняя версия могла только имитировать движение камеры, оставляя объекты статичными и часто изменяющимися от кадра к кадру. Новая версия YandexART (Vi) научилась поддерживать логичную связь между кадрами, создавая более плавные и цельные видео. Это стало возможным благодаря обучению на реальных роликах с движущимися объектами, такими как автомобиль или крадущийся кот.

«Если ИИ — это мозг робота, то RPA — его руки». Что умеют программные роботы

Работа нейросети основана на преобразовании текстовых запросов пользователей в последовательность кадров, которые плавно сменяют друг друга. В начале процесса модель создает начальное изображение по описанию, например, «носорог танцует хип-хоп в сумрачном лесу», а затем постепенно превращает цифровой шум в анимацию. Такой подход позволяет достичь более реалистичных и последовательных движений.

YandexART — это диффузионная нейросеть, разработанная для создания и улучшения изображений и анимации на основе текстовых описаний. Она способна обрабатывать загруженные фотографии, понимать российский культурный код и точно распознавать пожелания пользователей. Система работает в заданных художественных стилях и может создавать фотореалистичные портреты, интегрирована в Яндекс Шедеврум, Яндекс Бизнес, Директ, Браузер и Маркет. Компании могут также получить доступ к API YandexART через Yandex Cloud.

Хайтек+

07.09.2024 15:06