Сбер Kandinsky Video
Нейросеть для генерации полноценного видео

Продукт
Название базовой системы (платформы): Сбер Kandinsky Нейросеть для генерации изображений по описанию
Разработчики: Сбербанк
Дата премьеры системы: 2023/11/22
Технологии: Big Data

Основные статьи:

*2023: Представление первой в России генеративной модели для создания видеороликов по тексту

Сбер представил нейросеть Kandinsky Video — первую в России генеративную модель для создания полноценных видеороликов по текстовому описанию. Об этом 22 ноября 2023 года TAdviser сообщили представители Сбера. По словам первого заместителя Председателя Правления Сбербанка Александра Ведяхина, модель генерирует видеоряд продолжительностью до восьми секунд с частотой 30 кадров в секунду.

Видео, сгенерированное нейросетью Kandinsky Video

Архитектура Kandinsky Video состоит из двух ключевых блоков: первый отвечает за создание ключевых кадров, из которых складывается структура сюжета видео, а второй — за генерацию интерполяционных кадров, которые позволяют достичь плавности движений в финальном видео. В основе двух блоков лежит обновленная модель синтеза изображений по текстовым описаниям Kandinsky 3.0.

Формат сгенерированного видео представляет собой непрерывную сцену с движением как объекта, так и фона. Именно это отличает видеоролики, синтезированные моделью Kandinsky Video, от анимационных видеороликов, в которых динамика достигается за счёт моделирования пролёта камеры относительно статичной сцены. Нейросеть создаёт видеоролики с разрешением 512 х 512 пикселей и различным соотношением сторон. Модель обучена на датасете из более чем 300 тыс. пар «текст — видео». Генерация видео занимает до трёх минут.

Видео, сгенерированное нейросетью Kandinsky Video

«
«Недавно мы обучили Kandinsky создавать анимационные видео по текстовому описанию, а уже сегодня представляем модель совершенно другого уровня — первую в России модель по генерации полноценных видеороликов по тексту. Это важный вклад в развитие российских генеративных нейросетей. У пользователей появится ещё больше возможностей для креатива и реализации своих творческих задумок любой направленности», — заявил Александр Ведяхин, первый заместитель Председателя Правления Сбербанка.
»

.

Как он добавил, люди смогут создавать уникальные видеоролики абсолютно бесплатно. А сама модель будет доступна в open source. Елена Истомина, Directum: Как no-code меняет стоимость проекта 6.5 т

Видео, сгенерированное нейросетью Kandinsky Video

Ранее у активных пользователей Kandinsky 2.2 в тестовом режиме появилась возможность создания анимационных видеороликов. По одному запросу можно создать видео длиной в четыре секунды с выбранным эффектом анимации, с частотой 24 кадра в секунду и разрешением 640 х 640 пикселей. Пользователи нейросети Kandinsky 3.0 также могут создавать видеоролики по текстовому описанию в режиме анимации. Оценить возможности нейросети Kandinsky Video можно на платформе fusionbrain.ai и в Telegram-боте[1], где можно оставить заявку на доступ.

Нейросеть разработали и обучили исследователи Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.

Примечания



СМ. ТАКЖЕ (1)


Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  БизнесАвтоматика НПЦ (118)
  Большая Тройка (46)
  Умная Логистика (14)
  Доверенная среда (13)
  Инфосистемы Джет (11)
  Другие (417)

  Доверенная среда (5)
  Большая Тройка (4)
  Цифра (4)
  БизнесАвтоматика НПЦ (3)
  Ростелеком (3)
  Другие (54)

  БизнесАвтоматика НПЦ (13)
  OneFactor (Уанфактор) ЕдиныйФактор (3)
  РИР (Росатом Инфраструктурные решения) (3)
  Яндекс (Yandex) (2)
  Mains Lab (Мэйнс Лаборатория) (2)
  Другие (45)

  БизнесАвтоматика НПЦ (7)
  Департамент информационных технологий Москвы (ДИТ) (3)
  РИР (Росатом Инфраструктурные решения) (3)
  Axenix (ранее Аксенчер Россия) Аксеникс (2)
  CM.Expert (АвтоЭксперт) (2)
  Другие (61)

  БизнесАвтоматика НПЦ (3)
  Университет Иннополис (2)
  Синара-Транспортные Машины (СТМ) (1)
  Синимекс (Cinimex) (1)
  Axenix (ранее Аксенчер Россия) Аксеникс (1)
  Другие (21)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  БизнесАвтоматика НПЦ (2, 117)
  Большая Тройка (2, 46)
  Умная Логистика (2, 14)
  Доверенная среда (1, 13)
  РИР (Росатом Инфраструктурные решения) (3, 8)
  Другие (246, 109)

  Доверенная среда (1, 5)
  Большая Тройка (2, 4)
  Цифра (1, 4)
  БизнесАвтоматика НПЦ (1, 3)
  Умная Логистика (2, 2)
  Другие (6, 8)

  БизнесАвтоматика НПЦ (1, 13)
  РИР (Росатом Инфраструктурные решения) (2, 3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (1, 2)
  МегаФон (2, 1)
  Netrika (Нетрика) (1, 1)
  Другие (6, 6)

  БизнесАвтоматика НПЦ (1, 7)
  РИР (Росатом Инфраструктурные решения) (3, 4)
  Цифра (1, 2)
  CM.Expert (АвтоЭксперт) (1, 2)
  Датакаталог (1, 2)
  Другие (12, 12)

  БизнесАвтоматика НПЦ (1, 2)
  СПбГУ ИТМО (Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики) (1, 1)
  Exodrive (Экзодрайв) (1, 1)
  Softline (Софтлайн) (1, 1)
  Датакаталог (1, 1)
  Другие (6, 6)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Visary BI Платформа бизнес-аналитики - 117
  Большая Тройка: АИС Редактор территориальных схем - 39
  Доверенная среда: Триафлай BI-платформа - 13
  ZIIoT Платформа для работы с промышленными данными - 8
  Умная Логистика Транс - 7
  Другие 116

  Доверенная среда: Триафлай BI-платформа - 5
  ZIIoT Платформа для работы с промышленными данными - 4
  Visary BI Платформа бизнес-аналитики - 3
  Цифровая Траектория: Action Track (ATC) - 2
  Большая Тройка: АИС Редактор территориальных схем - 2
  Другие 10

  Visary BI Платформа бизнес-аналитики - 13
  Росатом Цифровое теплоснабжение - 2
  PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2
  СберАналитика - 1
  Yabbi Smart Panel (YSP) - 1
  Другие 6

  Visary BI Платформа бизнес-аналитики - 7
  CM.Expert Data Mining платформа - 2
  Росатом Цифровое теплоснабжение - 2
  ZIIoT Платформа для работы с промышленными данными - 2
  Arenadata Catalog - 2
  Другие 14

  Visary BI Платформа бизнес-аналитики - 2
  Rocket Group: rTIM Платформа генеративного дизайна территорий - 1
  Arenadata Catalog - 1
  Наносемантика NLab Marker - 1
  Softline Digital: RozniTech Платформа для сетевого ритейла (ранее Retailix.Ai) - 1
  Другие 3