27 апреля, по данным Wall Street Journal, в библейско-исторической драме «Царь Давид» производства Amazon настоящие актеры сыграли падших ангелов и смертных женщин, а окружающий пейзаж представлял собой созданный искусственным интеллектом шедевр, такой как хмурое стально-серое небо и скалистые горные хребты.

Рисунок 1. Предыстория «Династии Давида» создана с помощью искусственного интеллекта.
В первом сезоне шоу было 850 кадров с визуальными эффектами, 73 из которых были созданы с использованием генеративного искусственного интеллекта, в том числе инструмента, разработанного китайским видеосайтом Kuaishou. Wonder Project, продюсер шоу, заявил, что это позволяет сэкономить на дорогостоящих съемках на месте.
От голливудских блокбастеров до коротких видеороликов в социальных сетях — создатели видео все чаще обращаются к искусственному интеллекту для создания контента, для которого когда-то требовались большие команды видеооператоров.
«Поскольку затраты на производство падают, порог для авторов, которые могут экспериментировать и тестировать новые идеи, также снижается», — сказал Цзэн Юшен, руководитель отдела операций крупной модели Keling AI компании Kuaishou Video. Разработанная компанией модель искусственного интеллекта использовалась при производстве «Царя Давида».
Китайская видео-большая модель лидирует
Хотя большинство американцев, возможно, не осознают этого, когда смотрят телевизор или просматривают видео на своих телефонах, Китай играет важную роль в этой области. На долю китайских компаний приходится семь из 10 лучших моделей генерации видео, согласно рейтингу обзорной платформы Artificial Analysis, которые конкурируют с такими конкурентами, как Google и xAI Илона Маска.
В этом месяце модель генерации видео под названием «HappyHorse» стала вирусной после победы над американскими конкурентами в слепой оценке качества. Позже китайский гигант электронной коммерции Alibaba сообщил, что это была его собственная модель.

Рисунок 2. На долю Китая приходится 7 из десяти лучших видеомоделей.
Ранее в этом году Bytedance выпустила свой новейший видеогенератор с искусственным интеллектом Seedance 2.0, который также привлек большое внимание. Он может конвертировать текстовые подсказки в реалистичные короткие сцены из фильма. TikTok от ByteDance конкурирует с Kuaishou, у которого сотни миллионов пользователей в Китае.
Тилли Чжан, технологический аналитик исследовательской фирмы Gavekal, сказала, что эти платформы «естественно содержат огромные объемы размеченных коротких видеоданных, которые можно использовать для обучения моделей. Это создает барьер данных, который большинству компаний трудно воспроизвести».
Проблемы видеомодели
OpenAI недавно решила закрыть свой сервис создания видео Sora и прекратить сотрудничество с Disney. Другие американские компании, такие как Google, продолжают активно инвестировать в эту область.
Закрытие Sora подчеркивает технические и юридические проблемы, с которыми сталкиваются ИИ-видео. Создание видео может потребовать в сотни раз больше вычислительной мощности, чем приложение чат-бота, производящее текстовый ответ. OpenAI надеется избежать инвестиций в второстепенные проекты, которые потребляют слишком много вычислительной мощности, чтобы сосредоточиться на продуктах с более высокой прибылью.
Проблемы авторского права также преследуют отрасль. ByteDance отложила выпуск своего обновления Seedance в США из-за противодействия со стороны Голливуда. В Китае некоторые известные актеры также недавно публично осудили несанкционированное использование их изображений в видеороликах, созданных искусственным интеллектом.

Рисунок 3: OpenAI отключает Sora
Недавно китайская видеоплатформа iQiyi оказалась в центре скандала. Когда генеральный директор компании Гонг Ю представил проект искусственного интеллекта, который включает в себя библиотеку лицензирования портретов знаменитостей, он сказал: «Фотографии с реальными актерами вскоре могут уйти в прошлое». Как только прозвучало это заявление, многие известные актеры тут же высказались и заявили, что не имеют никакого отношения к проекту.
Тем не менее, видео с искусственным интеллектом все больше интегрируется в повседневную онлайн-жизнь людей, особенно в Китае, а также в Соединенных Штатах, где две сверхдержавы влияют друг на друга. Ранее в этом году серия абсурдных коротких пародий на фильмы о боевых искусствах, созданных искусственным интеллектом, собрала миллиарды просмотров в китайских социальных сетях и вдохновила большое количество фанатов на создание подобных видеороликов. Оригинальные видеоролики были созданы китайской пищевой компанией с использованием инструментов искусственного интеллекта ByteDance для продвижения своего продукта из тушеной утки.
Некоторые китайские стартапы в области видеомоделирования инвестируют в «модели мира», которые предназначены для моделирования физического мира. Некоторые исследователи утверждают, что роботы-гуманоиды, оснащенные превосходными моделями мира, могут демонстрировать поведение, более близкое к человеческому.
Будь то модель мира или генерация видео с помощью искусственного интеллекта, необходимо освоить основные математические и физические законы движения объектов в реальном мире. Многие компании, такие как Aishi Technology и Shengshu Technology, инвестируемые Alibaba, продвигаются одновременно в этих двух технических направлениях.
Короткая игра ИИ
Быстрорастущая индустрия короткометражных драм стала одной из первых, кто внедрил технологию генерации видео с использованием искусственного интеллекта. Эти сериалы, посвященные романтическим отношениям или семейной вражде, длятся всего несколько минут каждый и созданы для того, чтобы удержать зрителей прикованными к экранам телефонов. Из-за плотного темпа и частых поворотов сюжета зрители часто менее чувствительны к визуальным недостаткам при просмотре такого типа контента на маленьком экране.
Этот тип контента стал очень популярен в Китае, и мини-сериалы интегрируются в сайты электронной коммерции и приложения для доставки еды, чтобы конкурировать за внимание потребителей. В последнее время эта модель постепенно появилась и в США. Такие платформы, как ReelShort и DramaBox, созданные китайскими основателями, принесли десятки миллионов долларов дохода от американской аудитории.
В студии в городе Ханчжоу на востоке Китая Шао Чжикунь возглавляет команду из 60 человек по производству короткометражных драм с использованием искусственного интеллекта. Он сказал, что их рабочий процесс больше напоминал игру в лотерею, чем создание фильма.
Чтобы создать пригодную для использования сцену, команде Шао Чжикуня необходимо неоднократно вводить слова-подсказки в модель ИИ, что отнимает много времени и вычислительной мощности. Иногда, по его словам, успешные клипы имеют достаточное качество, чтобы служить основой для дальнейшей доработки. Команда также придумала, как сэкономить деньги, сначала создавая более дешевые статические изображения, а затем используя эти изображения в качестве подсказок, помогая модели создавать видеоролики, тем самым экономя затраты.
Команда Шао Чикуня использует инструменты Bytedance для создания 100 коротких драм каждый месяц для таких платформ, как Bytedance’s Hongguo Short Drama и ReelShort. Шао Чжикунь сказал, что затраты на производство варьируются от нескольких сотен долларов США до более чем 10 000 долларов США, что составляет лишь небольшую часть традиционного бюджета.
29-летний руководитель группы сказал: "Логика здесь другая. Мы не пытаемся создавать художественные шедевры. Пока одна-две драмы становятся хитами, затраты можно окупить".
Подобно видеоиграм, мини-сериалы пытаются заманить зрителей бесплатными эпизодами или трейлерами, а затем требуют от них заплатить или просмотреть рекламу, чтобы разблокировать последующий контент. Они также могут включать рекламные паузы в шоу.
Цзэн Юшен, руководитель отдела операций Kuaishou Keling AI, сказал, что спрос со стороны индустрии развлечений растет и за пределами Китая. Miracle Pictures, продюсер сериала «Царь Давид», сообщил, что во втором сезоне количество кадров, созданных с помощью инструментов генеративного искусственного интеллекта, было более чем в четыре раза больше, чем в первом сезоне.
Цзэн Юшен сказал, что 70% доходов Keling поступает из-за пределов Китая, а США являются ее основным рынком. Kuaishou сообщила, что в этом году планирует капитальные затраты в размере около 3,8 млрд долларов США, главным образом для удовлетворения растущих потребностей Keling в вычислительной мощности.
«Я прогнозирую, что в течение следующих года или двух видео с искусственным интеллектом достигнут уровня, на котором людям будет действительно трудно отличить подлинность от фальши», — сказал Цзэн Юшэнь. «Эта технология станет основой индустрии кино и развлечений».