1. НЕЙРОСЕТИ

Нейросети для генерации видео из фото

3 декабря 2025 г.

Рынок уходит от статики. Если ещё пару лет назад хватало одной симпатичной инфографики, сегодня в выдаче всё чаще мелькает видеообложка для маркетплейса: товар крутится, подсвечиваются выгоды, показывается использование.

Что это даёт:

  • по кейсам маркетплейсов и агентств видеообложки почти всегда дают рост CTR относительно статики;
  • в конкурентных нишах (одежда, бьюти, электроника) рост CTR по видеообложкам часто двузначный;
  • видео помогает выделиться там, где все уже умеют делать «красивые слайды».

И самое важное: чтобы сгенерировать видео из фото, уже не нужен продакшен. Сейчас можно:

  • собрать карточку в сервисе типа Fabula AI;
  • и тут же, на основе этой же картинки, сгенерировать видео по фото → получить готовую видеообложку для Ozon, WB или Яндекс.Маркета.

Раньше «поиграть с ИИ» означало просто оживить фото или сделать лёгкую анимацию фото ради эффекта. Сейчас задача прагматичная: выжать максимум CTR и конверсии с карточки.

Содержание:

  1. Как видеообложка влияет на CTR
  2. Требования к видеообложкам WB, Ozon и Яндекс.Маркет
  3. Лучшая нейросеть для генерации видео из фото
  4. Лучшие модели для видеогенерации: Veo, Sora 2, Kling и др.
  5. Топ сервисов для генерации видео из фото
  6. Сервисы говорящих аватаров: D-ID, HeyGen, Synthesia
  7. Российские сервисы для генерации видео
  8. Сравнение: модели и сервисы для генерации видео из фото
  9. Пошаговый чек-лист: создать видео по фото

Как видеообложка влияет на CTR

Когда мы говорим «видео для маркетплейсов», важен не только факт наличия ролика, но и то, как он сделан:

  • понятен ли товар и его ключевые выгоды;
  • читается ли бренд;
  • не ломается ли геометрия (ручки, крышки, упаковка).

По наблюдениям агентств и продавцов видео для карточки товара:

  • сильнее цепляет взгляд в выдаче: движение выигрывает против сотен статичных миниатюр.
  • лучше показывает объём: размер, фактуру, применение товара.
  • помогает быстрее считать ценность: покупатель видит не только «красивую картинку», а живой сценарий использования.

Когда конкуренты упираются только в графику, генерация видеообложек становится уже не «игрушкой», а конкретным инструментом роста CTR.

Требования к видеообложкам WB, Ozon и Яндекс.Маркет

Чтобы не делать видео «вслепую», соберём базовые требования площадок.

Параметры видеообложки:

ПараметрOzonWildberriesЯндекс.Маркет
Формат файлаMP4, MOVMP4, MOVMP4, MOV
Разрешение видеоот 1080 до 1920 pxот 720 до 1920 pxот 1080 до 1920 px
Размер файла≤ 20 МБ≤ 50 МБ≤ 100 МБ
Длительностьот 8 до 30 секунддо 3 минутдо 20 минут
Соотношение сторонвертикальное 3:4вертикальное 3:4явно не пишут, но можно — 3:4

Для нас критично:

  • вертикальное 3:4 — не 9:16, не квадрат;
  • хотя бы 8 секунд под Ozon (WB/Маркет проще по длительности);
  • HD или FullHD (1080p) — особенно если целимся в Ozon/Маркет;
  • разумный размер файла (20–50 МБ почти любые нейросети выдержат, если не просить у них минутное 4K).

Дальше будем смотреть на модели и сервисы через эту призму.


Лучшая нейросеть для генерации видео из фото

Fabula AI

Fabula AI — это сервис для создания инфографики для карточек товаров на маркетплейсах, внутри которого:

  • вы собираете инфографику под Ozon/WB/Я.Маркет;
  • и сразу же анимируете её в видеообложку.

Что происходит под капотом:

  • в Fabula AI встроен Kling 2.5 Turbo — одна из самых сильных моделей «оживления» картинок;
  • Fabula сама анализирует картинку и с помощью языковой модели придумывает промт для создания видео;
  • вам не нужно разбираться, как правильно просить нейросеть: достаточно отправить картинку, дальше сервис сделает всё сам.

Почему это удобно именно для маркетплейсов:

  • выходное видео заранее подогнано под требования Ozon, WB и Я.Маркет:
    • вертикальное 3:4;
    • длительность от 8 секунд (под Ozon);
    • HD/FullHD разрешение;
    • формат MP4, адекватный размер файла;
  • вам не нужно отдельно думать про формат видео для ВБ, формат видео для Озон — Fabula занимается этим в фоне.

Плюс важная деталь для российских селлеров:

  • Fabula можно оплачивать из России — без плясок с иностранными картами и блокировками.

По сути это решение «одним окном»:

  1. Вы собираете инфографику для карточки товара (шаблоны, шрифты, сетки уже заточены под маркетплейсы).
  2. Одной кнопкой превращаете её в видеообложку для маркетплейса — без промт-инженерии, монтажа и ручной подгонки форматов.

Примеры видеообложек:
Терка

Терка
Изображение
Видео

Лежанка для котов

Лежанка
Изображение
Видео

Наушники

Наушники
Изображение
Видео

Мужской парфюм

Мужской парфюм
Изображение
Видео

Итог:
Если вам не хочется разбираться в Kling, форматах и текстах для нейросетей, Fabula AI закрывает всё разом: карточка, видеообложка, соответствие требованиям маркетплейсов и удобная оплата из России.

Сгенерировать видео по фото в Fabula AI

Соберите инфографику под Ozon, WB или Я.Маркет — сервис сам сделает из неё видеообложку нужного формата и длительности.

Передовые модели для видеогенерации

Veo 3.1 (Google DeepMind)

Что умеет:

  • форматы: 16:9 и 9:16 нативно;
  • длительность: ~8 секунд за одну генерацию, длиннее — только склеиванием сцен;
  • качество: 720p или 1080p при 24 fps, очень реалистичный свет, движения и физика;
  • режим работы: умеет и видео по тексту, и «оживление» загруженного кадра;
  • доступ: через Google AI, доступ ограничен по странам.

Минусы: 

  • Потребуется VPN и подключение к региону США
  • Иностранная карта
  • Свежий Google аккаунт, который ранее не использовался

Пример видео:

 Veo

Итог:
Качество — космос, но это история про платформы и крупные команды. Как «зашёл сам, нажал пару кнопок и сделал видеообложку для маркетплейса» — пока нет.


Sora 2 / Sora 2 Pro (OpenAI)

Sora (часто называют Sora 1)

Первая версия модели и веб-редактор видео

  • Параметры: до ~20 секунд, до 1080p, разные соотношения сторон (9:16, 16:9, 1:1). Но нет 3:4.
  • Доступ: Для России потребуется VPN  и подписка ChatGPT Plus/Pro.
  • Оплата: отдельной цены у модели нет — она входит в подписку ChatGPT Plus/Pro.

Пример видео модели Sora:

Изображение

Sora 2

Новая флагманская модель видео+аудио: более реалистичная физика, лучшее следование инструкциям, синхронный звук/речь.

  • Каналы:
    • Приложение Sora (iOS + Android) — TikTok-подобное соц-приложение.
    • Веб (sora.com) — более продвинутый редактор.
    • Sora Video API (model sora-2) для разработчиков.
  • Где работает сейчас:
    • Официально только в: США, Канада, Япония, Корея, Вьетнам, Таиланд, Тайвань 
    • В ЕС (в т.ч. Нидерланды), России Sora 2 пока недоступен официально.

Sora 2 Pro

Sora 2 Pro — максимум качества, сложные сцены, больше вычислений, рендер дольше.

  • Где работает сейчас:
    • Sora Video API (sora-2-pro) с повышенной ценой.
    • Постепенно включается для ChatGPT Pro и некоторых пользователей Sora 2 (например, режимы High quality).

Итог:
Sora — очень мощная штука, которая умеет и говорить по-русски, и понимать русские описания. Но доступ нестабилен, формата 3:4 нет (нужно кадрировать), и это всё ещё не тот инструмент, куда селлер просто заходит и стабильно делает себе видеообложки.


Kling 2.5 Turbo (Kuaishou)

Что умеет:

  • форматы: 16:9, 9:16, 1:1, 4:3 и 3:4 — для нас это критично;
  • длительность: 5 или 10 секунд за генерацию, сцены можно соединять в более длинное видео;
  • разрешение: до 1080p при 24 fps;
  • режим работы: сильный упор на «оживление» загруженного фото, хорошо держит лица и объекты;
  • доступ: веб-сайт Kling AI, нет бесплатного доступа.

Пример видео:

Шляпка с вуалью

Итог:
Kling — один из самых интересных кандидатов для видеообложек: есть 3:4, хорошая стабильность, нормальное качество. Минусы — английский/китайский интерфейс и слабый звук, но для «немых» видеообложек это не критично. В чистом виде модель не супер-удобна для массового селлера, зато отлично работает как двигатель внутри готового сервиса — именно так Kling встроен в Fabula AI.


Seedance 1.0 (ByteDance)

Что умеет:

  • форматы: 16:9, 9:16, 1:1, 4:3, 3:4, 21:9;
  • длительность: 5–10 секунд на сцену, до ~12 секунд за один запрос; можно собирать мульти-сюжетные ролики;
  • разрешение: до FullHD;
  • режим работы: одна модель и для видео по тексту, и для видео по загруженному фото; акцент на кинематографичных сюжетах и плавном движении;
  • доступ: через партнёров или корпоративный API.

Пример видео:

Тональный крем

Итог:
Seedance идеально подходит под видеообложки по возможностям, но сфокусирован на студиях и платформах. Для одиночного продавца это скорее двигатель внутри чужого сервиса, чем инструмент «в пару кликов».

Промежуточный вывод

Напрямую Veo, Sora, Seedance и «голый» Kling — это скорее про платформы и крупные стеки. Селлеру удобнее, когда такие модели уже упакованы в готовый сервис, где:

  • есть русский интерфейс;
  • не надо думать о форматах Ozon/WB/Маркет;
  • можно платить из России.

Топ сервисов для генерации видео из фото

Если смотреть на задачу глазами селлера, первым номером в этом списке будет Fabula AI: внутри уже встроен Kling 2.5 Turbo, форматы и длительность подогнаны под требования маркетплейсов, а оплату можно провести из России. Ниже — массовые международные сервисы, которые можно использовать как альтернативу или «песочницу» для экспериментов.

Runway Gen-2 (RunwayML)

Что умеет:

  • форматы: из коробки 16:9, но есть поддержка 9:16, 1:1, 4:3 и 3:4 через настройки и кадрирование;
  • длительность: базовый клип 4 секунды, с функцией Extend можно нарастить до ~15–18 секунд;
  • разрешение: стандартно 1280×720, на платных планах есть более высокие варианты и апскейл вплоть до 4K;
  • режим работы: умеет генерировать видео и по тексту, и по загруженному кадру (image-to-video) — второй вариант даёт больше контроля;
  • доступ: обычный SaaS-сервис, есть бесплатные кредиты и платные тарифы.

Минусы: английский интерфейс, промты лучше писать по-английски, бесплатная версия с водяным знаком.

Итог:
Runway — один из самых жизнеспособных вариантов «в лоб»: привычная регистрация, понятный веб-интерфейс, нормальное качество. Можно сделать короткий ролик из фото товара и растянуть его дозированно до 8–12 секунд.

Genmo AI

Что умеет:

  • работает в браузере, позволяет сгенерировать видео онлайн по фото или тексту;
  • поддерживает разные форматы: 16:9, 1:1, 3:4, 2:3, 4:3 и другие;
  • в бесплатной версии делает ролики до ~6 секунд;
  • выдаёт разрешение на уровне 480–720p;
  • щедрый бесплатный лимит — примерно до сотни коротких роликов в день, платный тариф расширяет пределы.

Плюсы:

  • много бесплатных попыток;
  • можно руками настраивать «камеру» и характер движения;
  • удобно сгенерировать видео из фото бесплатно, чтобы понять, как может «ожить» карточка.

Минусы:

  • нет стабильного FullHD;
  • интерфейс и модель ориентированы на английский;
  • пост-монтажа почти нет, всё придётся дорабатывать отдельно.

Итог:
Genmo хорошо подходит как песочница: протестировать идеи, стили, сценарии анимации. Под строгие требования Ozon/WB по длине и качеству — слабоват как финальный инструмент.

Pika Labs

Что умеет:

  • позволяет сгенерировать видео по фото или по тексту;
  • поддерживает форматы 16:9, 9:16, 1:1, 5:2, 4:5, 4:3;
  • в бесплатной версии делает ролики примерно по 3 секунды, на платном тарифе — до ~10 секунд;
  • выдаёт 720p с водяным знаком бесплатно и до 1080p без логотипа на платном;
  • есть настройки движения, частоты кадров и даже генерации звука.

Плюсы:

  • для своих размеров клипы выглядят довольно эффектно;
  • можно оживлять загруженные фото и играться с движением.

Минусы:

  • в бесплатной версии слишком короткие ролики для видеообложки;
  • нормальная длина только на платном плане;
  • нужен VPN и терпимость к англоязычному интерфейсу.

Итог:
На платном тарифе Pika можно использовать для видеообложек: сгенерировали 9:16 или 4:3, в монтажке обрезали под 3:4 — и получили 8–10 секунд. Главное — быть готовым к VPN и небольшому количеству ручной работы.


Сервисы говорящих аватаров: D-ID, HeyGen, Synthesia

Эти сервисы не столько анимируют фото товара, сколько делают виртуального ведущего, который говорит на камеру. Полезно, когда нужно быстро собрать обучающее или приветственное видео.

D-ID Creative Reality Studio

Что умеет:

  • делает реалистичных говорящих аватаров по фото;
  • поддерживает форматы 16:9, 1:1 и 9:16;
  • длительность до 15 минут;
  • разрешение до 1080p;
  • поддерживает десятки языков, включая русский.

Итог:
Отлично подходит, чтобы записать обращение, инструкцию, презентацию. Для видеообложки конкретного товара — слаб: это «говорящая голова» на фоне, а не анимация самой карточки.

HeyGen

Что умеет:

  • большой выбор готовых аватаров и голосов;
  • поддержка 16:9 и 9:16;
  • ролики до десятков минут;
  • разрешение от 720p до 4K.

Итог:
Классный инструмент для маркетинговых и обучающих видео с диктором. Для «немой» динамичной видеообложки товара — не то, что нужно.

Synthesia

Что умеет:

  • делает ролики с виртуальными ведущими для обучения и презентаций;
  • поддерживает 16:9, 9:16, 1:1 и другие форматы;
  • длительность до 10 минут на ролик (на стартовом плане);
  • выдаёт 1080p.

Итог:
Идеален для корпоративных обучающих видео. Как инструмент для видеообложки для маркетплейса с крутящимся товаром — совсем не про это.


Российские сервисы для генерации видео

Kandinsky 3.1 (FusionBrain)

Что умеет:

  • делает как картинки, так и короткие видео по тексту и по загруженному изображению;
  • поддерживает форматы 16:9, 9:16 и 1:1;
  • умеет создать видео по фото нейросеть с русскими промтами;
  • ролики получаются длиной до ~10 секунд, на практике чаще 3–5 секунд;
  • работает бесплатно через Сбер ID, без VPN.

Плюсы:

  • полностью русскоязычный интерфейс;
  • можно детально прописывать, как должна двигаться сцена;
  • отлично подходит, чтобы создать видео по фото нейросеть бесплатно и быстро показать идею команде.

Минусы:

  • генерация нестабильна, иногда приходится несколько раз перегенерировать;
  • разрешение и качество ниже, чем у топ-сервисов;
  • чаще получается просто «слегка подвижная картинка», а не полноценная сцена.

Итог:
Kandinsky — отличный способ прототипировать идею «живой карточки» без вложений. Но под боевые видеообложки Ozon/Маркет/Я.Маркет его качества обычно недостаточно.

Шедеврум (Yandex)

Что умеет:

  • оживляет фото в фиксированном формате 4:3;
  • делает очень короткие анимации по 2–3 секунды;
  • работает только из мобильного приложения;
  • доступен бесплатно по Яндекс ID.

Плюсы:

  • максимально простой вход: зашёл, загрузил фото, получил «живую» картинку;
  • внутри есть что-то вроде «соцсети» с чужими примерами, можно вдохновляться.

Минусы:

  • только смартфон;
  • фиксированный формат и невысокое разрешение;
  • ролики слишком короткие и простые.

Итог:
«Шедеврум» — отличный инструмент «поиграться» и оживить фото, но не рабочий вариант под требования маркетплейсов к видеообложкам.

NeuroSphere (оживление фото)

Что умеет:

  • умеет оживить фото, особенно портреты и старые фотографии;
  • по умолчанию делает вертикальные ролики 9:16, формат можно менять;
  • длительность около 5 секунд;
  • улучшает, восстанавливает и анимирует лица;
  • даёт несколько бесплатных токенов, дальше — оплата.

Плюсы:

  • объединяет улучшение и анимацию фото в одном месте;
  • хорошо добавляет мимику и движение к фронтальным портретам.

Минусы:

  • строгие лимиты бесплатных генераций;
  • иногда заметная «странная» мимика;
  • больше заточен под лица, чем под предметку.

Итог:
NeuroSphere можно попробовать для карточек, где человек держит товар, но как основной рабочий инструмент под товарную фотку он слаб.


Сравнение: модели и сервисы для генерации видео из фото

Модель / сервисЧто по длительности и качествуМинусы / ограниченияСтоимость
Fabula AI (Kling 2.5 внутри)8+ секунд, HD/FullHD, 3:4, MP4, авто-промтПлатный сервис, завязан на экосистему Fabulaот 2990₽/мес
Veo~8 с, HD/FullHDДорогой, сложный доступот 20$/мес
Sora Короткие ролики, HDБета, нет массового доступаот 20$/мес
Kling5–10 с, до FullHD, есть 3:4В чистом виде неудобен без обвязкиот 7$/мес
Seedance 1.0Короткие сцены, FullHDДоступ через APIот 0,47$/генерация
Runway Gen-24 с + Extend до 10–15 с, HD+Подписка, англ. интерфейсот 12$/мес
Genmo AIДо ~6 с, 480–720pСлабо под строгие требования маркетплейсовот 10$/мес
Pika Labs3–10 с, 720p–1080pНужен VPN, мало секунд бесплатноот 24$/мес
Kandinsky 3.1Несколько секунд, умеренное качествоНедостаточно стабилен под боевые видеообложки0₽/мес
Шедеврум2–3 с, фикс. форматНизкое разрешение, очень коротко0₽/мес
NeuroSphere~5 с, вертикаль 9:16Больше про портреты, чем про товарот 890₽/мес
D-ID / HeyGen / SynthesiaДо 10–30 мин, 1080p–4KНе решают задачу предметной анимациив зависимости от модели

Пошаговый чек-лист: создать видео по фото

Вариант 1. Через Fabula AI (путь «хочу результат без боли»)

  1. Соберите инфографику в Fabula AI:
    • выберите шаблон под нужный маркетплейс;
    • расставьте выгоды, иконки, подписи;
    • убедитесь, что товар читается.
  2. Отправьте картинку в генерацию видеообложки:
    • Fabula анализирует изображение;
    • формирует промт под встроенный Kling 2.5 Turbo;
    • запускает нейросеть для генерации видео из фото.
  3. Получите готовую видеообложку:
    • вертикальное 3:4;
    • длительность и размер файла соответствуют требованиям;
    • остаётся только загрузить видео в карточку на Ozon/WB/Я.Маркете.
  4. Оплатите привычным способом:
    • Fabula AI можно оплачивать из РФ, без танцев с иностранными картами.

Проверить, как видеообложка влияет на CTR

Возьмите любую свою карточку, сделайте к ней видео в Fabula AI и посмотрите, как изменится кликабельность и конверсия в заказ.

Вариант 2. Через отдельные сервисы (Runway, Kling как сервис и др.)

  1. Подготовьте фото товара.
  2. Зайдите в выбранный сервис (Runway / Pika / Genmo / «голый» Kling).
  3. Напишите промт, подберите формат (9:16 или 3:4), длину ролика.
  4. Перегенерируйте до приемлемого результата.
  5. Скадрируйте под 3:4, проверьте размер файла и длительность.
  6. Загрузите в карточку.

Оба пути рабочие, просто во втором вы берёте на себя всю «грязную» работу по промтам, форматам и монтажу.

FAQ

1. Можно ли оживить фото бесплатно и использовать это как видеообложку?

Можно воспользоваться режимами «оживить фото», «нейросеть оживить фото» или «оживить фото нейросеть бесплатно» в сервисах вроде «Шедеврум», Kandinsky, NeuroSphere. Но:

  • ролики обычно получаются 2–5 секунд;
  • разрешение невысокое;
  • анимация больше про лицо, чем про товар.

Для боевой карточки лучше использовать решения вроде Fabula AI (Kling внутри) или Runway, где изначально можно сгенерировать видео по фото в нужном формате.

2. Что лучше для карточки: анимация фото или полноценное видео из фото?

Лёгкая анимация фото и «ИИ анимация фото» — это когда чуть двигается фон, свет, мелкие детали. Это лучше, чем чистая статика, но:

  • мало показывает товар «в объёме»;
  • часто выглядит как эффект ради эффекта.

Полноценное видео из фото (облет камеры вокруг товара, смена ракурсов) работает лучше на CTR и доверие. Поэтому логика такая:
анимировать фото — промежуточный этап,
создать видео по фото нейросетью — финальный формат под маркетплейс.

3. Какая нейросеть для генерации видео из фото бесплатно подойдёт для старта?

Чтобы «пощупать» без бюджета:

  • Kandinsky 3.1 — позволяет создать видео по фото нейросеть бесплатно и писать промты по-русски;
  • Genmo AI — даёт много попыток и разные форматы, удобно проверять сценарии движения;
  • Шедеврум — быстро «оживляет» фото и вдохновляет примерами других.

Когда видите, что идея работает, логично перейти к более серьёзному решению — например, Fabula AI, где всё завязано на требования маркетплейсов.

4. Когда достаточно «нейросеть оживить фото», а когда нужно полноценное видео?

Если задача — эмоция (старое фото, семейный альбом, соцсети), хватает режима «нейросеть оживить фото»: лицо моргнуло, повернулось, улыбнулось.

Если цель — продажи на маркетплейсе:

  • нужен внятный показ товара;
  • нужно соблюсти формат видео для ВБ и формат видео для Озон;
  • нужно удержать внимание 8–15 секунд и донести выгоды.

Здесь выигрывает полноценная нейросеть для генерации видео по фото вроде Kling (через Fabula AI) или Runway, а не просто анимация лица.

5. Можно ли сгенерировать видео по фото бесплатно и сразу залить на Ozon/WB?

Технически — да, если сервис выдаёт нужное разрешение, длительность и формат. Практически:

  • бесплатные сервисы ограничены по длине и качеству;
  • часто ставят водяные знаки;
  • формат приходится подгонять вручную.

Рабочая стратегия:

  1. На тестах — сгенерировать видео из фото бесплатно (Kandinsky, Genmo, «Шедеврум»), понять, заходит ли вообще идея живой карточки.
  2. Для боевого варианта — использовать решение типа Fabula AI (с Kling внутри), где вы одновременно делаете инфографику и генерацию видеообложек под требования маркетплейсов.

Читайте также

Зачем использовать нейросеть Fabula в работе?

Fabula AI — уникальная платформа с интегрированными нейросетями для профессионалов в сфере создания контента. Мы предлагаем инструменты для создания изображений, текстов, аудио и видео, обеспечивая удобное хранение и простой обмен файлами. Поддержка русского языка, работа без установки дополнительного ПО и интуитивный интерфейс делают рабочий процесс проще и доступнее. Присоединяйтесь к Fabula прямо сейчас!