Что может ИИ рассказать о каталонской литературе?

Автор: вс, 20 Апр. 2025 - 05:00

Категория: Святой Георгий , Литература , Мерсе Родореда , Хосеп Пла , Ким Монсо , Письменники , Книги , Издательство

Что может ИИ рассказать о каталонской литературе?

В нескольких словах

Статья исследует, как искусственный интеллект может помочь в анализе и понимании литературных стилей известных каталонских писателей, таких как Мерсе Родореда и Жозеп Пла. Эксперименты с ИИ выявляют закономерности в использовании слов и предлагают новые интерпретации произведений.

Когда была изобретена фотография, публика должна была научиться смотреть на живопись по-новому.

Уже недостаточно было технического восхищения, нужно было найти что-то магическое, способное выйти за рамки изображения реальности. С тех пор, как мы можем сказать, что текст выглядит написанным ChatGPT, мы читаем и пишем, как будто робот смотрит на нас из-за плеча, гиперсознание, которое говорит нам, что сейчас важнее, чем когда-либо, не поддаваться процедурным глаголам или вычурным прилагательным. Как мы читаем наших любимых авторов сейчас, когда есть модели, способные их имитировать? Что может искусственный интеллект рассказать о гении Жозепа Пла или Мерсе Родореды? Чтобы отпраздновать Сант Жорди, мы решили это исследовать.

Подробнее: Выбор критиков Quadern на Сант Жорди 2025. Родореде нравится смотреть.

Однажды в этот дождливый зимний день я пошел в мастерскую коллектива Estampa (в который входят Даниэль Питарх, Пау Артигас, Рок Альбалат, Марсель Пие и Марк Падро) в районе Грасиа. В углу около десятка человек смотрели на экран, которым манипулировал один из них. На столе – премия Ciutat de Barcelona, которую они получили накануне. Ее заслужил проект Cartografia de la IA Generativa, карта, которая переводит искусственный интеллект, такой эфирный, в то, чем он является на самом деле: набор ресурсов, механизмов и человеческой деятельности. Жюри говорило о «прозрачности и доступности», потому что одним из столпов этой группы программистов, режиссеров и исследователей является спуск искусственного интеллекта с всемогущего пьедестала, который он обычно занимает, и придание ему материальности. Мы так привыкли к технократам, которые доминируют в Интернете, что можно ожидать от них высокомерия тех, кто завоевал объективное знание, но то, что я нахожу в их предложениях, – это игривое любопытство ко всему, что из этого ускользает.

Я не знаю ничего, что связано с инженерией и программированием, но я читал эссе Nabokov's favorite word is Mauve (Simon & Schuster) Бена Блатта. Опубликованное в 2017 году, когда мы говорили больше о больших данных, чем об искусственном интеллекте, это эссе ставит такие объективные стратегии, как статистический анализ, на службу такой субъективной и романтической цели, как выяснить, что нас соблазняет в чьем-то письме. Оказывается, писатели, которые исторически считались хорошими, используют меньше наречий, чем остальные; что за последние десятилетия бестселлеры сократили диапазон слов; или, как говорится в названии, любимое слово Набокова – «лиловый». Это не единственный эксперимент, который стремился связать статистику и литературу: в Интернете нетрудно найти инструменты с открытым исходным кодом, которые позволяют извлекать оценку из любого текста и даже превращать его в декоративный плакат. Прелесть всего этого в том, что алгоритм перестает быть угрозой, которая заменит писателей, и становится инструментом для того, чтобы лучше их слушать.

Вдохновленные Блаттом, мы хотели по-новому прочитать наших авторов. Мы решили выделить любимые слова четырех писателей, двух живых и двух мертвых, очень известных и читаемых, потому что мы хотели проверить, вызывает ли результат эффект узнавания предвзятых идей или странности. В Estampa изолировали все слова из произведений Жозепа Пла, Мерсе Родореды, Сержи Памиеса и Ирене Солы (они описывают это как «развязывание жемчужного ожерелья»), удалили наиболее распространенные слова (артикли, предлоги или очень процедурные глаголы), а также те, которые повторялись в схожих пропорциях между всеми четырьмя. То есть извлеченные слова – это не совсем самые используемые, а те, которые по статистике считаются наиболее идиосинкразическими, если сравнивать их друг с другом.

Больше всего в результате удивляет то, что он так мало удивляет. В списке каждого есть что-то, что заставляет думать, что, когда мы читаем, наш мозг также функционирует как статистическая машина, которая делает выводы на основе повторений. Мы думаем, что улавливаем тайну, но также считаем слова. Почти неприлично убеждаться, что, если сегодня мы думаем, что Пла – лучший переплетчик реальности и литературы, то это также немного потому, что он настаивал на включении реальности в свою литературу. Кажется, нет ничего более креативного, чем быть систематичным.

Схемы с любимыми словами Мерсе Родореды (сверху слева), Жозепа Пла (сверху справа), Ирене Солы (снизу слева) и Сержи Памиеса (снизу справа) ESTAMPA

Детектор статистических особенностей говорит нам, что слово, которое лучше всего отражает поэтику Родореды, занимает 0,355% ее работы и является «смотреть». Она использует еще больше «видеть», 0,541%, и «глаза», 0,443%, но алгоритм заставляет нас заметить, что они слишком общие, чтобы отличать ее от трех других авторов. Всего год назад Неус Пенальба опубликовала эссе Fam als ulls, ciment a la boca (3i4), где, говоря об «окулярцентрическом повествовании», она собирает ответы Родореды на «Анкету Пруста» 1979 года: «- Мое любимое занятие? - Смотреть [...]. - Каким было бы мое самое большое несчастье? - Не иметь возможности смотреть». Но гений литературы Родореды дает не настойчивость в теме, а все то, что она способна вызвать вне текста каждый раз, когда смотрит. В голодных глазах или в глазах, которые хотят убежать из глазниц от страха, есть философия, потому что у Родореды слова не описывают опыт, они делают его мучительно физическим: руки останавливаются «над» (0,454%) сердцем, чтобы оно не убежало («Казалось шелковым»).

Если глагол, который Родореда использует чаще всего, – это «говорить», то любимый глагол Пла – «быть» во всех его временах. Учитывая широту его журналистской работы, очевидно, почему его любимые слова появляются в гораздо меньшем проценте. Его журналистское стремление состоит в том, чтобы использовать язык для составления карты реальности (0,104%), и поэтому его любимые слова часто являются именами, которыми мы называем вещи: страна (0,376%), история (0,115%), книга (0,106%) или дух (0,094%).

Сержи Памиес однажды сказал, что в литературе, полной дезориентированных мужчин, он решил не включать женщин из-за смеси осознания нелепости липких мужских писаний и потому, что он не осмеливается их интерпретировать. Тем не менее, женщина появляется в его литературе (0,321%), но часто как иронический объект: «женщина моей жизни». Это единственный, кому я показываю результат этой игры: вопрос его совсем не удивляет, и он признается мне, что, когда он пишет, он проводит тот же эксперимент в более грубой форме, чтобы исключить повторы. Но больше всего (0,810%).

Прежде всего, в Et vaig donar ulls i vas mirar les tenebres (Anagrama) женская генеалогия очень важна у Ирене Солы: дочери остаются дома (0,497%) и наследуют от матерей (0,455%) фольклор и истории, которые делают нас теми, кто мы есть, в то время как мужчины (0,293%) участвуют в Истории. И всегда говорили, что Ирене Сола вдохновляется Родоредой. Настолько, что в предыдущем эксперименте Estampa, в книге M'has parlat i t'he dit que et vaig dir que no et digui (Como), Сола поняла, что немного разговаривает с ней, когда беседует с нейронной сетью, обученной на каталонских литературных текстах. Как и у Родореды, у Солы много слов о теле и пространстве, но повторение слов, согласно алгоритму, не обязательно указывает на сходство в других измерениях.

Большая библиотека.

Обычная проблема в библиотеке – насколько произвольным может быть порядок. Книга Пережауме имеет больше смысла в разделе природы, поэзии или эссе? Есть много факторов, которые делают одну книгу более или менее похожей на другую, от установленных литературных жанров до семантических полей, тем или структуры предложений. Что произойдет, если библиотека сможет превзойти три измерения? Можно ли создавать отношения на многих уровнях одновременно, даже больше, чем мы воспринимаем? Это то, что называется скрытым пространством, «математическая карта, где модель ИИ размещает закономерности и отношения, которые она нашла в словах, которыми она была обучена», – говорят в Estampa. Мы решили протестировать его с первыми десятью названиями опроса лучших книг за последние пятьдесят лет, который мы опубликовали здесь всего год назад.

Полученные отношения являются абстрактными для человеческого глаза, но могут сделать что-то столь же поэтичное, как поместить одну книгу рядом с другой и намекнуть вам, что там есть смысл. В некотором скрытом измерении оказывается, что Jo confesso – это поперечное произведение, что Сола и Родореда не очень похожи, но Сола, Марсаль и Рохальс похожи; что Монкада и Роиг соприкасаются, а Пажес Жорда и Монзо делают ту же параллельную дугу. ESTAMPA

Супружеская спальня.

Мы все пробовали это дома, и чат-боты, как правило, работают лучше, когда им нужно имитировать темные тексты, полные цветистых выражений, а не более трезвые прозы. Есть что-то в стилистической очистке, что парадоксально трудно имитировать, потому что каждое слово обязано содержать больше смысла. Поэтому мы решили проверить ИИ с таким эталоном трезвости и очистки, как Ким Монзо. С согласия редактора Сандры Ольо мы попросили у него разрешения обучить модель его полным произведением, и он сказал «да». Модель, которую Estampa использовала, была предварительно обучена на каталонском языке с Aina, проектом Generalitat de Catalunya, направленным на продвижение каталонского языка в цифровой среде, который никто не знал, что закончится таким экспериментом. То есть он имеет более узкий и конкретный корпус текста, чем генераторы, к которым мы привыкли.

На основе обработки текстов модель научилась распознавать конкретные шаблоны Монзо и сгенерировала несколько вариантов текста, которые в совокупности представляют собой гротескное резюме его творчества: здесь есть сексуальность, посредственность современной жизни в городе, абсурдные раздвоения и множество перечислений – один из рассказов был таким: «Мужчина сел за стол. Он взял блокнот и записал: «Сегодня, впервые за долгое время, я сделаю то, что наполняет меня радостью: напишу рассказ». Он начал печатать. Второй абзац он оставил незаконченным. Третий был готов. Четвертый тоже»; и перечисление продолжалось до достижения неудобно несуществующих чисел. То, что мы выбрали, странно, но идиосинкразично: «Резюме, которое он делает из произведений Монзо, совсем не лишено смысла», – говорит Борха Багунья, когда я прошу его проанализировать это, – «обманчиво повседневный мир, простой синтаксис, металитературный знак (например, сложные имена пародии на мелодраму «Величие трагедии» или игра внутри и снаружи с картиной и сном), взрыв более или менее несчастной сексуальности; но меня утешает констатация того, что он еще не уловил его юмор или гений языка».

Рассказ Кима Монзо.

Накануне Анна-Франческа провела утро, убирая ящики прикроватной тумбочки. Она сняла наволочки с подушек и надела новые. Затем она сделала то же самое с одеялами. И с простынями. Когда она закончила, она встала и пошла в одну из комнат, примыкающих к супружеской спальне. На одной из стен она повесила картину, на которой изображена женщина, сидящая в красном кресле и смотрящая в неопределенную точку комнаты. Анна-Франческа спросила ее, чего она хочет. Рамон-Мария сказал ей, что ничего. Девушка посмотрела на картину несколько секунд, а затем сорвала ее со стены и положила на стол. Пальцами Анна-Франческа карандашом отметила три зоны на картине: сидящую женщину, красное кресло и фон комнаты. Затем она подошла и потрогала ее. Там не было нарисовано ни стула, ни кресла. Однако там был нарисован фон комнаты: серая стена, без мебели, за исключением большого белого дивана у стены и низкого столика, также белого, у окна. Мужчина не совсем понимает, почему он это сделал, но когда он поставил его обратно на место, ему показалось, что он видит себя сидящим в том же красном кресле, смотрящим в комнату, откуда она теперь наблюдала за картиной. Анна-Франческа прошла в гостиную, где Рамон-Мария оставил ей книгу для чтения. Анна-Франческа не заставила себя долго ждать, чтобы закончить ее. Потом, когда Рамон-Мария уже спал, она оставила ее на подушке и легла на нее. Рамону-Марии приснилось, что она была в постели с ним, раздетая и мастурбирующая. В этом рассказе есть странность, как будто мы слушаем комический монолог на иностранном языке: мы можем догадаться, что нас пытаются рассмешить, но не почему. Монзо никогда не написал бы о «супружеской спальне» или «книге для чтения» без ироничного намерения, которое здесь невозможно расшифровать. В словах этого искусственного Монзо есть отпечаток мира, который создал настоящий Монзо; в то время как в словах настоящего Монзо есть отпечаток того, кто хочет создать новый мир. Мы ставим их друг перед другом, и в расстоянии, которое их разделяет, есть удовольствие от поиска новых скрытых значений, любимых слов и оригинальных сравнений. В конечном счете, желание продолжать читать.

Здесь вы можете прочитать статью коллектива Estampa.