Искусственное завершение Десятой симфонии Бетховена


Иллюстрация Оливия Мейер / NZZ
«Внимание, сегодня вечером вы услышите будущее – риски и побочные эффекты неясны». Этот предупреждающий знак был бы уместен тем октябрьским вечером 2024 года в штаб-квартире Brainlab в районе Мюнхен-Рим. Поначалу всё выглядело как обычно: ожидающая публика в тёмном зале, освещённая сцена. Но затем произошло нечто необычное. Помимо исполнителей и композиторов, на подиуме появился искусственный интеллект (ИИ), невидимый, но безошибочно узнаваемый.
Для работы важных функций NZZ.ch требуется JavaScript. Ваш браузер или блокировщик рекламы в настоящее время блокирует эту возможность.
Пожалуйста, измените настройки.
Например, было исполнено произведение Франца Шуберта, которое было продолжено в различных вариациях с помощью искусственного интеллекта. В следующем фортепианном концерте сольная партия была полностью сочинена искусственным интеллектом и сыграна на самоиграющем фортепиано; только оркестровая партия потребовала участия человека. Третье произведение было метко названо «Переговоры»: человек и машина в диалоге, спорят и борются за креативность и звук.
Было ли это всего лишь безумным экспериментом? Или то, что вдохновляло или раздражало публику на этом совместном концерте Мюнхенской высшей школы музыки и Мюнхенской филармонии, на самом деле и есть музыка будущего?
Немного ментального киноПри изучении значения цифровизации и искусственного интеллекта для музыки возникают вопросы экзистенциального масштаба. Как будет звучать музыка в ближайшие десятилетия и столетия? Как ИИ изменит, в частности, устоявшийся мир классической музыки? Существует ли такое понятие, как техническое творчество? И станут ли люди в конечном итоге заменимыми создателями произведений искусства?
Уже давно это не вызывает сомнений: искусственный интеллект развивается, и он не ограничивается миром гармоний, ритмов и мелодий. Напротив, есть все основания полагать, что сейчас происходит настоящая революция — как на сцене, так и за её пределами, в офисах разработчиков программного обеспечения, издателей цифровой музыки и в студиях многих композиторов.
Здесь тесно переплетаются ужас и очарование. Попробуйте, например, недавно выпущенное приложение Cantai. Хоровые и вокальные композиции исполняются обманчиво реальными голосами; однако поразительно «человеческий» звук — это чистый искусственный интеллект. Или попробуйте сами с помощью программ для сочинения музыки, таких как Udio или Suno: всего нескольких ключевых слов достаточно, чтобы создать музыкальное произведение, сгенерированное искусственным интеллектом.
На первый взгляд, это гигантская провокация. Разве не именно это индивидуальное творчество, эта изобретательность определяют человечество? А если нет? Что, если в будущем композиторы потеряют работу, инструменталистов заменят компьютеры, играющие безупречно, а машина превратится в нового Моцарта?
Здесь мы остановим мысленные образы, прежде чем ваш пульс продолжит учащаться, и рассмотрим ситуацию поближе. Цифровизация в мире музыки — явление отнюдь не новое; она началась в 1970-х годах, когда появились первые технологии цифровой записи. Первой вехой стал формат MP3, который впоследствии упростил передачу музыки через интернет. В 1981 году технически подкованный дирижёр Герберт фон Караян представил в Зальцбурге компакт-диск, став мировой сенсацией. В результате аналоговые устройства хранения данных, такие как кассеты и старые добрые пластинки, всё больше отходили на второй план, несмотря на колоссальный рост музыкального рынка.
Это тоже уже история. Сегодня стриминговые сервисы являются важнейшими платформами для распространения музыки, и когда компания Open AI представила первые широкоязыковые модели, даже музыканты, ранее работавшие исключительно по аналоговым технологиям, почувствовали, что в будущем к композиторам, исполнителям и преимущественно механическим инструментам может присоединиться ещё один игрок.
Десятая симфония Бетховена«Многие фрагменты пазла привели нас к тому, где мы находимся сегодня», — говорит Маттиас Рёдер. Будучи директором Института Караяна в Зальцбурге, он в 2021 году возглавил проект «Beethoven X – The AI Project», который обсуждался во всём мире. Задача заключалась в том, чтобы наконец завершить незаконченные черновики Бетховена для Десятой симфонии. Этого можно было достичь с помощью так называемой архитектуры трансформатора, в рамках которой искусственные нейронные сети были обучены выявлять статистические накопления комбинаций.
«Как и в случае со словами, с нотами существует причинно-следственная связь», — объясняет Рёдер, и модель-трансформер отображает вероятности: то есть, какая нота, исходя из характерного стиля Бетховена, вероятнее всего последовала бы за предыдущей, если бы он сам сочинил произведение. Для этого ИИ предоставили произведения самого Бетховена, а также произведения его современников; затем ему предоставили сохранившиеся наброски композитора к Десятой симфонии и попросили их развить.
Команда экспертов наконец изучила результат, тщательно отредактировала его и создала коллаж. Реакция на финальную премьеру полной версии симфонии была столь же противоречивой, сколь и любопытной. «Были некоторые фрагменты, о которых слушатели говорили: Бетховен никогда бы не написал её так. А ведь именно эти фрагменты были оригинальными для Бетховена», — с усмешкой говорит Рёдер.
Рёдер рассматривает ИИ как «инструмент и спарринг-партнёра», который можно использовать для замечательных экспериментов, в том числе для поиска ответов на вопрос: как работает человеческое творчество и что его определяет? «Дискуссии, основанные на страхе, ни к чему не приведут», — говорит Рёдер, хотя и признаёт, что применение ИИ всё ещё нуждается в объяснениях. «Многие до сих пор воспринимают ИИ как своего рода чёрный ящик, который умеет говорить. Но это не живое существо, а просто статистическая машина, работающая с тем, что мы, люди, сказали или сочинили».
«Только люди могут это сделать»Али Никранг, профессор кафедры искусственного интеллекта и музыкального творчества Мюнхенской высшей школы музыки и соруководитель описанного выше футуристического концерта, исследует, как максимально эффективно использовать эту статистическую машину в музыкальной практике. «Компьютеры гораздо быстрее людей. Меня всегда интересовал вопрос, как они могут помочь нам сочинять», — говорит Никранг. Он не видит противоречия между художественной оригинальностью и сухой статистикой.
Действительно, люди не сочиняют музыку в вакууме, а находятся под влиянием окружающей их музыки, традиций и культурных влияний. Также нет ничего нового в том, чтобы понимать музыку как композицию структур. «Моцарт уже случайным образом комбинировал различные фразы в своей „Музыкальной игре в кости“, и Карл Филипп Эммануил Бах тоже экспериментировал с фрагментами», — говорит Никранг.
Однако, в отличие от людей, у ИИ отсутствует фильтрованное восприятие, позволяющее проводить эстетическую оценку. Для исследователя это также открывает новые возможности: «ИИ может дать нам новые взгляды на музыку. У него бесконечное количество данных, но он не классифицирует и не судит — это преимущество». За своей кафедрой он и его ученики обучают ИИ, используя широкий спектр классических произведений. Главный вопрос: «Что мы можем сделать с ИИ, чтобы было интересно с точки зрения искусства и захватывающе ново?»
ИИ уже способен сочинить произведение, звучащее более-менее связно, как Моцарт или Гайдн. «Но композитора это не особенно интересует. Его больше интересует: где я нахожусь в музыке? Как использовать ИИ, чтобы он не просто имитировал, а был полезен мне как человеку с моей жаждой самовыражения?» — говорит Никранг. Он не видит в ИИ угрозы присущей человеку креативности. Под угрозой находятся только области, связанные исключительно с имитацией. В большинстве случаев человек по-прежнему остаётся решающим фактором в конце цепочки. Причина: хотя машина может выдавать различные музыкальные сценарии, она не способна распознать, какие из них могут быть актуальны для человечества. «Это зависит от соответствующего социального контекста — только люди могут это сделать», — говорит Никранг.
Для практикиСовременные технологии должны облегчить жизнь музыкантов – конкретно, практично и максимально без бюрократии. Так считает Боян Виденофф, художественный руководитель Мангеймской филармонии и основатель приложения Enote. Как и многие его коллеги, он десятилетиями таскал стопки нот в портфелях с концерта на концерт, переносил проверенные карандашом аппликатуры на другие издания и кропотливо искал в архивах разные издания. Теперь он пользуется исключительно цифровыми нотами.
Для приложения он и его команда разработали технологию, предназначенную для перевода оригинальных нотных текстов в полностью оцифрованные файлы. Работает она следующим образом: ноты сканируются, а затем полученное изображение загружается в ИИ. ИИ анализирует символы, составляющие изображение — «всё, что чёрное», как говорит Виденофф. Теперь ИИ правильно идентифицирует более 99% этих символов.
«Качество зависит от объёма обучающих данных, имеющихся у ИИ», — говорит Виденофф. Чтобы найти оставшиеся отклонения, нужны не только дополнительные обучающие данные, но и большое сообщество, знаменитый роевой интеллект, который поможет их исправить — то есть, опять же, люди. «В противном случае это финансово невыгодно», — говорит Виденофф. Промежуточным шагом на этом пути являются так называемые «интеллектуальные PDF-файлы», в которых соответствующая структура страниц зафиксирована в нотации, но ИИ уже может распознавать повторы и предложения, а также выделять отдельные голоса. Для солиста, которому, например, приходилось размечать оперную партию маркером на сотнях страниц, чтобы лучше её отрепетировать, это, безусловно, облегчение.
Когда Виденофф говорит о возможностях, которые могут открыться в будущем, он почти впадает в эйфорию. Конечная цель, в лучшем случае, — это «полностью модифицируемый документ, к которому смогут подключаться и другие технологии», — с энтузиазмом говорит Виденофф. Тогда станут возможны «безумные вещи» — например, ИИ, слушающий музыку и «переворачивающий страницу» в нужный момент, или даже отмечающий неправильно исполненные фрагменты.
Виденофф и его коллеги рассматривают основу своего творчества, сами произведения, как «общую собственность». Издательский мир находится под давлением, и Виденофф надеется на лицензионные соглашения. Представители издательств, такие как Эстер Петри, управляющий директор Carus Verlag, и Пауль Шеффер из Schott Verlag в Майнце, уже издававшего произведения Бетховена, видят ситуацию несколько иначе.
Что касается оцифровки нот, то здесь тоже происходят перемены: после пандемии издательство Carus Verlag также продаёт цифровые PDF-файлы, и в настоящее время на него приходится около четырёх процентов всего рынка. «Здесь ещё есть куда расти», — говорит Петри, добавляя, что многие любители, в частности, поют и играют музыку по печатным нотам, то есть с бумаги. В Schott спрос также растёт «медленно и стабильно, но отнюдь не быстро», — говорит Пауль Шеффер. «Мы исходим из того, что будем относиться к печатной и цифровой музыке одинаково как минимум ещё десять лет. Тем не менее, мы готовимся к возможному поворотному моменту и в настоящее время начинаем комплексный проект сканирования для оцифровки около 5 миллионов страниц наших производственных шаблонов».
Оба понимают привлекательность такого приложения, как Enote, но всё ещё многое предстоит прояснить. «Проблема заключалась в том, что компания изначально не рассматривала нас, издателей, как партнёров и игнорировала последствия использования наших издательских продуктов с точки зрения авторских прав», — говорит Шеффер. Петри добавляет: «Необходимо чёткое юридическое решение по контрактам. Как издатели, мы стремимся к тому, чтобы точно записать музыку — максимально точно и максимально практично. Здесь требуется большой опыт в музыкальной сфере».
Из глубины вековКак цифровизация обогащает музыкальный мир, можно увидеть в аббатстве Сен-Пьер-де-Солем на северо-западе Франции. Бенедиктинцы молились, трудились и пели здесь тысячелетиями, но в последние годы здесь происходит нечто поистине энциклопедическое. С 2019 по 2022 год был реализован масштабный проект по записи, результатом которого стало приложение Neumz. Оно содержит полный сборник григорианских песнопений трёхлетнего цикла Novus Ordo, доступный в любое время и в любом месте.
Кроме того, группа экспертов работает над оцифровкой всего солесмского архива, используя специально обученный искусственный интеллект для DIMM (Архива цифровых изображений средневековой музыки в Оксфорде). Для этой цели сканируются и каталогизируются 400 000 страниц рукописей и около двух миллионов песнопений. В настоящее время предполагается, что в ходе этого гигантского процесса будет обнаружено более 4000 песнопений, которые можно будет услышать впервые за более чем 1000 лет.
«Будущее из прошлого» – девиз проекта, в рамках которого давно скрытые сокровища из глубин монастыря теперь извлекаются на свет и систематически обрабатываются с использованием самых современных технологий. Руководитель всего проекта – Джон Андерсон. Он считает возможности, открывающиеся благодаря использованию искусственного интеллекта, «увлекательными и одновременно пугающими». В случае с архивами Солема технический интеллект помогает выполнить задачу, которая в ином случае казалась бы сверхчеловеческой. «Этот монастырь – единственное место в мире с такой плотностью материалов Средневековья», – говорит Андерсон.
Все эти транскрипции сейчас транскрибируются с помощью искусственного интеллекта, чтобы в будущем сделать их доступными в цифровом формате для музыковедов по всему миру и для исполнения на концертах. Однако без человеческого вмешательства и интеллекта здесь практически ничего не работает. Поэтому изначально музыковеды транскрибировали рукописи вручную, чтобы иметь достаточно материала для обучения ИИ.
На этой основе ИИ был обучен переводить древние рукописи в цифровые ноты. Это чрезвычайно сложная задача, чреватая ошибками. «80 процентов материала, транскрибированного таким образом, верны», — говорит Андерсон. Окончательное дополнение и исправление ошибок снова должны выполнять исследователи. Таким образом, люди и машины работают вместе, чтобы перенести ценные композиции из прошлого в настоящее. «Всё, что у нас есть сегодня, основано на этой музыке», — говорит Андерсон. Григорианское пение — это первоисточник, и как только вы начинаете слушать и заново открывать для себя музыку, которой порой более тысячи лет, вы обретаете принципиально иное понимание значения времени и ритма.
Цифровой концертный залВ конечном счёте, музыка призвана трогать людей, и никто не может сделать это сильнее, чем сами люди. Цифровизация и растущее использование искусственного интеллекта, похоже, никак на это не влияют. В некоторых случаях всё наоборот: в конце концов, цифровые технологии позволили транслировать музыку по всему миру без существенной потери качества. Олаф Манингер, виолончелист и медиа-директор Берлинской филармонии с 1994 года, убедился в этом на собственном опыте. Ведущий оркестр Германии всегда был технически подкован, что во многом связано с Караяном как дирижёром-основателем. Когда в 1990-х годах стало всё сложнее получить запись или эфирное время для симфонического произведения, у Манингера возникла идея.
«Тогда мы хотели создать систему безопасности, которая сделала бы нас независимыми от звукозаписывающих лейблов и вещательных компаний. А потом появился интернет», — объясняет Манингер. Его видение: каждый концерт Берлинской филармонии будет транслироваться по всему миру и в любой момент будет доступен в архиве. То, что сегодня кажется очевидным, тогда многие считали безумием; в конце концов, не было ни смартфонов, ни приложений. «Но было очевидно, что у интернета невероятный потенциал. Поэтому мы просто начали и надеялись, что технологии подтянутся», — говорит Манингер.
При поддержке крупного банка техническая команда установила необходимое звукозаписывающее оборудование в Берлинской филармонии и запустила пилотный проект. Сегодня концерты элитного оркестра доступны в превосходном качестве записи на всех устройствах, а созданный в результате цифровой концертный зал стал, безусловно, самой успешной стриминговой платформой в сфере классической музыки. Теперь он полностью самоокупаем.
Жизнь и деятельность Берлинской филармонии кардинально изменились благодаря дополнительному медиаизмерению — в лучшую сторону, как говорит Манингер. «Живые концерты — наша визитная карточка, они навсегда останутся в наших архивах. Это наделяет нас как музыкантов ещё большей ответственностью». Осознание того, что, помимо 2400 человек в зале, их живые выступления слушают до 15 000 человек по всему миру, даёт им «невероятный кайф» от игры.
С момента создания цифрового концертного зала поклонники по всему миру не только следят за выступлениями Берлинской филармонии, но и приобщаются к оркестру. «Когда они потом посещают наши концерты в Нью-Йорке или Токио, они уже становятся частью семьи», — говорит Манингер. Тот факт, что люди продолжают приходить на выступления, несмотря на прекрасную трансляцию, нисколько не удивляет музыканта. «В такие вечера происходит невероятное взаимодействие энергий. Зал потрескивает от напряжения, волнения и предвкушения, а затем музыканты погружаются в эту ауру, и может произойти один из тех долгожданных волшебных моментов», — говорит Манингер. Ощущение живого выступления просто незаменимо.
nzz.ch