OpenAI анонсировала выход Sora — нового инструмента для создания видео с помощью искусственного интеллекта. Пользователи с платными подписками ChatGPT Plus и Pro теперь могут генерировать короткие ролики, используя текстовые описания или изображения в качестве исходных данных.
Что умеет Sora?
- Создание видео из текста и изображений. Sora позволяет комбинировать элементы, создавать ремиксы и объединять их в связные видеоряды.
- Длительность и качество. Максимальная длина ролика составляет 20 секунд, а доступное разрешение — до 1080p.
- Реалистичная физика и визуальные эффекты. OpenAI утверждает, что кадры, созданные с помощью Sora, сложно отличить от реальных.
Ограничения и доступ
Для использования Sora необходимо подписаться на тарифы ChatGPT:
- Plus ($20 в месяц): до 50 видео в месяц с разрешением 720p.
- Pro ($200 в месяц): приоритетная генерация до 500 видео, разрешение до 1080p, отсутствие водяного знака.
Также есть строгие правила использования:
- Нельзя загружать медиа с изображениями реальных людей без их согласия.
- Видео людей младше 18 лет запрещено.
- Нарушение правил может привести к блокировке аккаунта.
На момент релиза Sora доступна только в ряде стран, включая США, Канаду, Австралию, Индию, Японию, Южную Корею и многие другие регионы. Полный список доступных стран опубликован на сайте OpenAI. Однако пользователи из стран Евросоюза и Великобритании не могут получить доступ к Sora из-за регуляторных ограничений.
Попытка зайти через VPN из США вечером 11 декабря показала, что даже это не всегда помогает: система сообщает о высокой нагрузке на серверы и не позволяет создавать новые аккаунты. Это делает доступ к Sora ограниченным даже для пользователей из поддерживаемых стран.
Интерфейс и возможности
Sora предлагает интуитивный интерфейс с широкими возможностями:
- Настройка параметров: соотношение сторон, разрешение, продолжительность, стиль видео.
- Галерея и папки: организуйте свои проекты для удобного доступа.
- Storyboard: инструмент для точной настройки видео по кадрам.
Первые впечатления пользователей
Несмотря на амбициозные заявления, Sora получила смешанные отзывы. Пользователи отметили длительное ожидание генерации и ошибки нейросети, такие как «галлюцинации» — неверные интерпретации реальности. Впрочем, нашлись и те, кто обуздал новый text2video генератор и уже опубликовал свои работы в общий доступ.
Однако, на форумах все чаще можно увидеть мысль, что стоимость подписки не оправдывает возможностей Sora, указывая на ограничения и высокую конкуренцию со стороны других видеогенераторов, таких как Runway и Kling.
Ниже несколько примеров работ от реальных пользователей с Reddit
Выводы
На данном этапе Sora сталкивается с рядом существенных проблем, которые ставят под сомнение её практическую ценность. Помимо ограниченной доступности и перегруженных серверов, основной вызов заключается в том, как сама нейросеть справляется с задачами. Пользователи отмечают частые «галлюцинации» — ситуации, когда Sora генерирует неверные или вымышленные ответы. Это значительно подрывает доверие к её результатам, особенно для тех, кто рассчитывает на точность и надежность.
Ограничения с доступом лишь усугубляют проблему. Даже пользователи из поддерживаемых стран сталкиваются с невозможностью создать новый аккаунт, а попытки обойти это через VPN наталкиваются на перегруженные серверы. Таким образом, Sora не только недоступна для широкой аудитории, но и не всегда справляется с основными задачами для тех, кто получил доступ.
Пока OpenAI не решит обе эти проблемы — доступность и качество генерации — говорить о реальной пользе Sora преждевременно. Несмотря на заявленный потенциал, сервис на данном этапе больше разочаровывает, чем впечатляет. Однако, если OpenAI сумеет устранить технические и содержательные недостатки, Sora всё же может стать востребованным инструментом. Для этого потребуется значительная доработка и доказательство того, что её ответы можно использовать с уверенностью.