
В нескольких словах
Новая функция генерации изображений OpenAI стала вирусной благодаря возможности имитировать стиль Studio Ghibli, что привело к рекордному спросу. Это вызвало дискуссии о значительном прогрессе ИИ в создании изображений, подняло вопросы об авторских правах на стиль (особенно в контексте японского законодательства) и усилило опасения о влиянии ИИ на человеческое творчество и уникальность искусства.
Компания OpenAI объявила, что её новый инструмент для генерации изображений Imagen теперь доступен всем пользователям, а не только платным подписчикам. Спустя неделю после запуска Imagen, однако, прочно ассоциируется с одним именем: японской анимационной студией Ghibli. Миллионы людей использовали новый инструмент для воссоздания семейных или исторических фотографий в стиле студии легендарного Хаяо Миядзаки. По какой-то причине инструкции по созданию таких «мемов» распространились среди людей, обычно далеких от этой темы.
Хотя изображения, сгенерированные ИИ, пережили свой момент славы ещё до появления ChatGPT, сейчас кажется, что они достигли нового пика популярности. Использование ChatGPT выросло до невиданного за последние 12 месяцев уровня, согласно данным Google Trends, особенно по сравнению с Grok, ИИ от X, который также показал заметную активность на этой неделе.
Сэм Альтман, соучредитель OpenAI, заявил, что никогда не видел подобного спроса и что пользователи прибывали в приложение миллионами. Хотя у чат-бота, по словам самого Альтмана, уже 700 миллионов ежемесячных пользователей, прирост в миллион пользователей «за час» всё равно поражает. Что же произошло? Сложно дать однозначный ответ, но вот несколько версий.
1. Изображения стали несомненно лучше
Раньше генерация изображений в стиле Ghibli с помощью ИИ требовала усилий и результат был далёк от идеала. Теперь же создание таких картинок доступно 700 миллионам пользователей буквально в один клик. Это уже не просто «заметно, что это ИИ». Ghibli — лишь один пример возможностей нейросети, но по какой-то причине именно этот стиль выбрал сам Альтман для анонса запуска.
Почему это больше, чем просто очередной мем? Во-первых, он преодолел границу обычной виральности. Мем не просто распространяется — миллионы анонимных пользователей генерируют свои семейные фото в стиле Ghibli. Этим занялись и знаменитости, политики и даже армии.
В Испании технологический аналитик Антонио Ортис был одним из первых, кто сделал вирусный мем в стиле Ghibli. «Это просто модный мем или демонстрация мощи чего-то большего? Я бы сказал, и то, и другое», — говорит он. «Как мем, он, очевидно, будет иметь короткий жизненный цикл. Однако технологический прогресс идёт гораздо дальше. То, что представила OpenAI, отличается от классических моделей генерации изображений, которые у нас были до сих пор. Это значительно повышает уровень понимания ваших намерений и работы с семантикой того, что находится внутри изображения», — добавляет он.
Вопрос в том, сможет ли мем на данном этапе повторения повлиять на сам бренд: сможем ли мы воспринимать Тоторо или Тихиро так же, зная, что ИИ может легко их скопировать?
2. А как же права?
Даже аватар Сэма Альтмана сегодня в X — это изображение, сделанное в стиле Ghibli. Хотя стиль не защищён авторским правом так, как произведения, бесцеремонное использование стиля Ghibli вызвало дебаты, которые часто заглушаются потоком всё новых и новых изображений.
OpenAI, должно быть, знала, что законы в Японии более мягкие. Чтобы воспроизвести стиль Ghibli, OpenAI, несомненно, использовала изображения из фильмов Studio Ghibli. «Это могло бы подвергнуть их иску за нарушение авторских прав», — пишет в своём блоге Андрес Гуадамус, профессор права интеллектуальной собственности в Университете Сассекса (Великобритания). «Однако дело не так однозначно, как многие утверждают. Предполагая, что Studio Ghibli подаст иск в Японии, первым препятствием будет то, что японский закон об авторском праве имеет широкое исключение для сбора текстов и данных, что, по-видимому, позволяет такого рода обучение в коммерческих целях».
Более того, количество изображений Ghibli в открытом доступе в интернете, вероятно, уже было огромным. «Есть причина, по которой контент Studio Ghibli так легко воспроизвести: он повсюду в сети, со скриншотами на форумах, гифками в социальных сетях... Нарушители — это мы. Мы те, кто предоставляет данные. В интернете доступно три десятилетия контента Ghibli», — добавляет Гуадамус.
3. Человеческая меланхолия
OpenAI уже участвует в других судебных баталиях по поводу прав. Помимо юридической битвы, этот новый мем и его совершенство затронули более глубокую и всё более распространённую проблему: ИИ развивается всерьёз, очень всерьёз. Трудно избежать этой меланхолии. Профессор и эксперт по ИИ Итан Моллик возвращается к этому сообщению каждый раз, когда происходит очередной символический шаг: «Я не могу до конца доверять людям, которые хотя бы немного не деморализованы некоторыми недавними достижениями ИИ».
Дизайнер и основатель студии Mendesaltaren Дэнни Сальтарен написал о Ghibli длинное сообщение в X, также полное человечности перед лицом неизбежного натиска машины: «Все, и когда я говорю все, значит абсолютно все референсы доступны для вмешательства любому человеку. Это означает, что любой может генерировать или создавать. Проблема остаётся там же: мало людей с хорошими референсами или вкусом. Теперь у нас будет мир, полный бездушных, бессодержательных вещей, якобы красивых, где нормой станет безвкусица».
В своём сообщении он пытался найти объяснения для выживания человеческого труда: «Теперь всё лучше, да, но и стандартнее. Правильнее. И скучнее. Мы просим ChatGPT не ошибаться. Скоро мы будем просить его ошибаться. Случайно. Чтобы нас не раскрыли. Чтобы никто не заметил, что мы перестали создавать и начали имитировать. Чтобы обмануть. Чтобы сделать вид, что мы всё ещё способны. Когда на самом деле мы способны только просить. Просить машину быть более человечной, чем мы».
Возможно, одно дело — совершенство машины. Год назад ютубер DamiLee задавалась вопросом: «Почему фильмы Studio Ghibli не могли бы быть сделаны с помощью ИИ». В понедельник некоторые пришли прокомментировать, что «это видео плохо состарилось». «Что вы имеете в виду?» — ответила DamiLee. «Вы думаете, что генерация изображений в „стиле“ Ghibli — это то же самое, что создание фильма Ghibli? И вы думаете, что эти изображения могут передать „душу“ их фильмов? Я спрашиваю серьёзно», — сказала она.
Не нужно быть экспертом по фильмам Ghibli, чтобы отличить настоящий кадр от имитации ИИ. Вероятно, ИИ достигнет и такого уровня детализации в кадре. Но остальной части фильма всё равно будет не хватать: «Почему Ghibli до сих пор выживает? Потому что мы решили идти в направлении, противоположном тренду», — говорил Хаяо Миядзаки. «Я никогда не думал о доминировании на рынке или победе в конкуренции. Проще, если всё движется в одном направлении, потому что тогда мы можем идти в противоположном. Если у вас нет такого менталитета, невозможно угнаться за этим обществом массового потребления и меняющихся тенденций».