Искусственный интеллект меняет рынок аудиокниг: дешевая озвучка угрожает профессиональным дикторам

Искусственный интеллект меняет рынок аудиокниг: дешевая озвучка угрожает профессиональным дикторам

В нескольких словах

Использование искусственного интеллекта для озвучивания аудиокниг набирает обороты, значительно снижая затраты и время производства. Это выгодно издательствам и расширяет доступ к контенту, но вызывает беспокойство у профессиональных дикторов и поднимает вопросы прозрачности и прав на использование голосов.


Звучит удивительно естественно. Отличная дикция, слова плавно перетекают друг в друга, формируя беглые фразы с правильными паузами. Интонация и темп речи кажутся человеческими. Но это не так. Мы слушаем аудиокнигу, озвученную искусственным интеллектом, а не человеком. Эта тенденция вызывает серьезное беспокойство у профессиональных дикторов, чьи доходы уже стремительно падают. В то же время, издательская индустрия видит в этом путь к демократизации публикации аудиокниг, делая их доступными не только для крупнейших игроков рынка.

Рынок аудиокниг находится в фазе активного роста. По оценкам отраслевых экспертов, его объем значительно увеличивается из года в год. Преобладающее большинство пользователей отдает предпочтение моделям подписки.

Согласно прогнозам консультантов, работающих в сфере подкастов и аудиокниг, уже к концу этого десятилетия синтетические голоса могут количественно превзойти человеческие в производстве аудиокниг. В настоящее время в мире насчитывается около 1,3 миллиона аудиокниг, озвученных людьми. Однако темпы роста производства с использованием ИИ, особенно на зрелых рынках, таких как США и Великобритания, указывают на скорое изменение этого соотношения.

Руководители издательств подтверждают, что рынок аудиокниг, созданных с помощью ИИ, готов к быстрому развитию. Некоторые компании активно инвестируют в собственные технологии, адаптирующие существующие решения под нужды книгоиздания. Это позволяет значительно ускорить процесс: готовую аудиокнигу можно получить всего за полтора дня, в то время как студийная запись занимает недели. Важно отметить, что такие инструменты включают элементы человеческого контроля для обеспечения определенного уровня качества.

Основная причина успеха синтетических голосов — колоссальное снижение производственных затрат. Озвучка аудиокниги с помощью ИИ может быть как минимум в 10 раз дешевле. В то время как студийная запись книги объемом около 380 страниц может стоить 3500-5000 евро, использование ИИ снижает эту сумму до 200-300 евро. Это открывает двери для небольших издательств, позволяя им выйти на рынок аудиокниг. Эксперты сходятся во мнении, что доступ к большему количеству контента благодаря ИИ выгоден слушателям, но признают, что профессионалы, такие как дикторы, переводчики и иллюстраторы, сталкиваются с серьезными вызовами. Человеческие голоса, вероятно, останутся востребованными для премиального контента или художественных произведений, где важна эмоциональная составляющая.

Профессиональные дикторы подтверждают, что искусственный интеллект уже существенно повлиял на их доходы, снизив их, по некоторым оценкам, на 50% за последние несколько лет. ИИ перебирает на себя озвучивание контента, не требующего сильной эмоциональной вовлеченности, например, документалистики или публицистики. Эта тенденция, по их убеждению, будет только усиливаться.

Качество синтетических голосов заметно улучшилось за последние годы. Хотя они пока наиболее распространены в нехудожественной литературе, где нюансы интерпретации имеют меньший вес, отличить их от человеческих становится все труднее. Специалисты индустрии считают, что человеческие голоса не исчезнут из аудиокниг полностью, особенно в художественной литературе, где требуется передача страсти и эмоций. Однако исследования показывают, что для нон-фикшн контента слушателей меньше заботит личность диктора.

Некоторые платформы используют ИИ не только для озвучивания, но и для расширения функционала для слушателей. Например, предлагаются опции, позволяющие переключаться между различными голосами (как синтетическими, так и человеческими) для одной книги, персоналізуя опыт прослушивания. Такие функции призваны дополнять, а не заменять человеческих нараторов, и могут помочь удержать пользователей, которые отказывались от книги из-за не понравившегося голоса.

Остро стоит вопрос прозрачности: как слушателю узнать, озвучена ли аудиокнига человеком или ИИ? Синтетические голоса уже очень реалистичны, особенно в нехудожественной литературе. Отличить их от человеческих часто сложно, а некоторые платформы или издательства дополнительно усложняют ситуацию, не указывая явно метод озвучки.

Существуют тревожные примеры, когда издатели маскируют использование ИИ, присваивая синтетическим голосам человеческие имена или даже создавая целые «семьи» голосов под одной фамилией. Это, по мнению профессиональных актеров дубляжа и дикторов, является не только неэтичным, но и лишает потребителя важной информации о том, что он слушает искусственный голос.

В индустрии активно обсуждаются стандарты маркировки аудиокниг, озвученных ИИ. Предлагается различать «голоса ИИ» (синтезированные из множества источников) и «авторизованные копии голоса» (созданные на основе записей конкретного диктора с его согласия). Подчеркивается ответственность издателей за надлежащее обозначение использования ИИ в метаданных. Некоторые ассоциации считают целесообразным уведомлять об этом, если как минимум 10% озвучки выполнено синтетическими инструментами. Учитывая распространение аудиокниг, озвученных ИИ, жизненно важным является создание единой международной системы маркировки.

На данный момент не все участники рынка готовы открыто заявлять об использовании ИИ в озвучке, опасаясь, что это может быть воспринято потребителями как признак низкого качества. Эксперты сравнивают это с ситуацией в пищевой промышленности: если бы потребители знали все ингредиенты, возможно, они отказались бы от покупки некоторых продуктов.

Однако эта ситуация, вероятно, изменится. Новые законодательные акты, в частности в Европе, обязывают маркировать результаты, сгенерированные ИИ, чтобы их искусственный характер был очевиден, и предусматривают значительные штрафы за недоCompliance. Юристы, специализирующиеся на цифровом праве, подтверждают, что это относится и к озвучиванию аудиокниг, поскольку голос является формой интерпретации.

Крупные платформы уже внедряют ИИ для озвучивания части своих библиотек через партнерства с издательствами. Они заявляют, что аудиокниги, созданные синтетическими голосами, четко идентифицируются.

Издательства также осознают потенциальные юридические проблемы, связанные с публикацией аудиокниг, созданных с помощью ИИ. Помимо маркировки, ключевым вопросом являются права на синтетические голоса. Необходима четкая прослеживаемость и определение источника голоса. Появляются агентства, специализирующиеся на представлении «клонированных» голосов, позволяя профессиональным дикторам лицензировать свои голосовые модели за роялти и предоставляя издательствам сертификаты, подтверждающие авторизованное использование голоса.

Про автора

Специалист по технологиям, науке и кибербезопасности. Анализирует тренды, разбирает новые технологии и их влияние.