рейтинг блогов

Генератор видео по текстовому описанию - Sora от Open Ai

топ 100 блогов kvisaz16.02.2024 Open Ai (те, что сейчас держат ChatGPT) вчера рассказали, что у них есть чудесный генератор видео Sora - https://openai.com/sora

Но они его не дадут никому, кроме некоторых избранных, так что как тут верить? На волне хайпа сейчас каждый готов пообещать чудеса. К примеру, Гугл обещал, обещал сделать свою нейронку Gemini круче ChatGPT, а так и не смог. Правда люди пишут, что это произошло из-за чудовищного пресса многочисленных запретов, нейронку лоботомировали цензурой, а якобы Gemini наконец-то может писать внятные рифмы на русском языке, и вообще почти на любом.

Если предположить, что образцы видео на странице Sora - действительно сгенерированы нейронкой, то это очевидный огромный прыжок в генерации видео. Все, что было и есть сейчас - генерирует либо очень короткие ролики с эффектом "поворота камеры на несколько градусов", либо невероятно дрожащие, переливающиеся образы.

Пример известной генерации текущего поколения - "Уилл Смит есть спагетти". Это не Sora, это сгенерированное на нейронке видео полугодовой давности, которое отражает возможности  2023 года



Более популярная и качественная альтернатива у нынешних нейронок - это небольшое оживление статичной картинки. То есть берется пейзаж и немножко поворачивается из стороны в стороны. Берется портрет и немного оживляется лицо. При этом даже в качественных роликах заметны небольшие исчезновения или появления мелких деталей - совсем как при попытках генерации похожих одинаковых образов в разных ситуациях, что я пытался делать для комиксов.

Пример современной генерации видео. Вроде уже почти все хорошо, по сравнению с Уиллом Смитом, но допустимо ли такое дрожание образов в современной кинопродукции?



А теперь пример не видео, а картинки героя с разными позами в нейронке SDXL. Я привожу его только для того, чтобы вы могли отметить типичные проблемы генерации стабильного образа на нейронках, характерные для доступных систем как в статических фото, так и в видео. Мельчайшие и крупные пятна на лицах, морфирующий бэкграунд, мутирующий рюкзак.... Хотя в целом картинка и лицо остаются узнаваемыми, при попытке сделать хотя бы комикс всплывают все те же проблемы стабильности мелких деталей, что и в генеративных нейровидео 2023 года, как с танцующей девочкой выше.

Генератор видео по текстовому описанию - Sora от Open Ai




Теперь давайте посмотрим, что якобы может Sora в начале 2024 года

Портрет крупным планом - хорошо прорисованное фотореалистичное лицо с мелкими деталями. При движении сохраняются те же черты лица, те же детали, нет дрожания и комкания, выглядит как настоящая съемка.



Китайский Новый год -  очень много людей в кадре. Заметна некоторая неестественность движений, что, пожалуй, говорит в пользу реальной генерации на нейронке, но посмотрите, как стабильно от кадра к кадру воспроизводятся фигуры людей и какая хорошая у них анатомия (по сравнению с Уиллом Смитом на первом ролике)



Фантастическое видео в смысле сюжета - дельфины летающие в городе. Очень хорошее качество, нет дрожания, остается только вопрос - дешевли ли это и быстрее, чем рендерить с нуля в традиционном 3D пакете для подобной продукции?



Еще фантастики - мамонты



Больше видео - на странице https://openai.com/sora




Выводы

- Показанные ролики демонстрируют невероятный уровень качества видео по сравнению с видео, которые сейчас могут генерировать
- Показанные ролики показывают невероятный уровень консистентности, стабильности - пальцы не растут на ходу, детали лиц не меняются, число ногтей у мамонта остается прежним, горы и дома на заднем фоне сохраняют стабильность, как и требуется от фона.
- Длина роликов 9-20 секунд, достаточно чтобы рассмотреть


Если Sora от Open Ai действительно существует и дает генерацию видео по текстовому запросу с таким качеством - то это революция в малом и среднем кинобизнесе.

Скорее всего, как и ChatGPT, эту нейронку можно запустить на мощном серверном кластере, никак не дома, так что для прибыльной генерации Open Ai следует лишь указать цены ниже, чем могут дать самые нищие 3D-фрилансеры на Upwork.

Оставить комментарий

Архив записей в блогах:
Как они получаются? Получив единожды сертификат на оригинальную продукцию, есть ли гарантия что продавец не будет продавать фальсификат? Можно ли передать (продать) сертификат другому лицу? Какое наказание для продавца, если он работает по чужим сертификатам? Пока просто любопытствую.. ...
Случайно вчера включил НТВ, и наткнулся на ток шоу, какое не скажу, не обратил внимания на название, но тема меня заинтересовала. Тема, актуальная, Интернет – свобода или беспредел? Посмотрел с удовольствием. Правда, огорчился из-за того, что скоро ...
Власти России  готовят очередное повышение тарифов ЖКХ в 2024 году почти на 10%, что станет рекордным единоразовым повышением тарифов за последние десять лет. Залезть в карманы граждан путинскому  правительству нужно, чтобы найти деньги для "Газпрома", который потерял ...
Готовятся сразу три войны. Если на днях не договорятся - быть беде. Бдите армянские, азербайджанские, казахские и молдавские лайнеры. Нагнетание в средней Азии идёт полным ходом. Готовятся два крупных покушения и целая серия поменьше. Цели - две крупные фигуры и несколько  ключевых ...
Подскажите, где доступным языком объясняется subj? У меня есть, казалось бы, простой юс-кейс. Компьютер A: Windows. На самом компьютере открыт входящий TCP порт X, но сетка закрыта от входящих соединений извне (нет настоящего IP-адреса). Компьютер B: Windows, открыт исходящий TCP порт Y. ...