Генеративный ИИ, предоставленный сам себе, скатывается в шаблонность и примитив

Наталья Маркова Эксклюзив
VK X OK WhatsApp Telegram
Генеративный ИИ, предоставленный сам себе, скатывается в шаблонность и примитив

В рамках исследования ученые соединили систему преобразования текста в изображения и наоборот, заставив их выполнять циклический процесс «изображение — описание — изображение — описание». Несмотря на разнообразие исходных запросов, системы быстро пришли к узкому набору общих визуальных тем, таких как городские пейзажи и пасторальные сцены. Более того, они быстро теряли связь с первоначальным запросом, создавая визуально приятные, но бессмысленные результаты.

Эксперимент начинался с описания: «Премьер-министр изучает стратегические документы, собираясь убедить общественность в необходимости хрупкого мирного соглашения». Затем ИИ добавил к изображению подпись, которая использовалась для генерации следующего визуального элемента. В итоге исследователи получили изображение формального внутреннего пространства — без людей и динамики, лишенное ощущения времени и места.

Эти результаты указывают на то, что генеративные системы ИИ, работающие автономно, склонны к гомогенизации. Более того, можно предположить, что они уже функционируют таким образом по умолчанию.

Знакомое становится стандартом

На первый взгляд, данный эксперимент может показаться бессмысленным, поскольку большинство пользователей не требуют от ИИ бесконечного создания изображений. Процесс гомогенизации произошел без переобучения, а только из-за многократного использования. Однако этот эксперимент можно рассматривать как диагностический инструмент, показывающий, что происходит с генеративными системами без человеческого вмешательства.

Последствия могут быть значительными, так как такие системы все больше влияют на современную культуру. Изображения превращаются в текст, текст — в изображения. Контент подвергается ранжированию и фильтрации при переходе от одного формата к другому. В настоящее время статьи в интернете чаще пишутся ИИ, чем людьми, а когда и люди участвуют, они часто выбирают результаты, сгенерированные ИИ, вместо того, чтобы создавать что-то с нуля.

Это исследование подчеркивает, что по умолчанию системы склонны сжимать смысл до наиболее привычного и легко воспроизводимого.

Культурная стагнация или развитие?

Скептики предупреждают о потенциальной культурной стагнации, которая может возникнуть из-за избыточного синтетического контента, на котором будут обучаться будущие ИИ. В этом контексте рекурсивный цикл может привести к уменьшению разнообразия и инноваций.

Сторонники технологий, в свою очередь, утверждают, что каждая новая технология вызывала страхи о культурном упадке. Они считают, что окончательные решения все равно будут приниматься людьми.

Тем не менее, в этих дебатах не хватает эмпирических данных, которые могли бы прояснить начало гомогенизации.

Исследование не занимается переобучением на данных, созданных ИИ. Оно демонстрирует более фундаментальную проблему: гомогенизация происходит еще до вмешательства переобучения. Контент, создаваемый генеративными системами ИИ при автономном использовании, уже является упрощенным и универсальным. Это меняет представление о стагнации — риск заключается не только в том, что будущие модели могут обучаться на контенте, созданном ИИ, но и в том, что культура, опосредованная ИИ, уже подвергается фильтрации, отдавая предпочтение общепринятому.

Без паники

Скептики правы в одном: культура всегда адаптировалась к новым технологиям. Фотография не уничтожила живопись, а кино — театр. Цифровые инструменты открыли новые пути самовыражения. Однако ранее технологии не заставляли культуру бесконечно трансформироваться в различных средах глобально. Они не обобщали и не создавали заново культурные продукты — такие как статьи, песни или мемы — миллионы раз в день, следуя тем же представлениям о «типичном».

Эксперимент показал, что при многократном повторении цикла разнообразие сокращается не из-за злого умысла, а потому, что выживают только определенные виды смысла в процессе преобразования текста в изображение и обратно. Это не означает, что культурный застой неизбежен. Человеческое творчество неугасимо. Институты и деятели искусства находят способы противостоять гомогенизации. Но застой — это реальная угроза, если оставить генеративные системы без изменений.

Исследование также разоблачает миф о креативности ИИ: создание множества вариаций не равно инновациям. Система может генерировать миллионы изображений, исследуя лишь узкий фрагмент культурного пространства.

Для настоящего новаторства необходимо разрабатывать ИИ-системы, которые будут стремиться к отклонению от общепринятого.

Проблема перехода

Каждый раз, когда вы пишете подпись к изображению, часть информации теряется. То же самое происходит, когда изображение создается из текста. Это относится как к людям, так и к машинам. Таким образом, произошедшая конвергенция — это не только недостаток ИИ. Она отражает более глубокую проблему перехода между форматами: при многократном преобразовании сохраняются лишь наиболее стабильные элементы.

Однако, выявляя, что сохраняется в процессе преобразования, авторы исследования показывают, что смысл обрабатывается генеративными системами с тенденцией к обобщению.

Вывод неутешителен: даже при вмешательстве человека — будь то написание подсказок или выбор результатов — системы все равно отбирают одни детали и усиливают другие, основываясь на «средних» показателях.

Если генеративный ИИ должен обогащать культуру, то его системы должны быть сконструированы так, чтобы предотвращать снижение качества до статистически усредненных результатов. Нужно поощрять отклонения и поддерживать менее распространенные формы самовыражения.

Данное исследование наглядно демонстрирует: без соответствующих мер генеративный ИИ будет продолжать производить посредственный контент. Культурная стагнация — это не просто предположение. Она уже имеет место.

Источник
VK X OK WhatsApp Telegram

Читайте также: