№3

Творчество закончилось?

Андрей Аспидов — креативный и музыкальный продюсер, звуко-блогер, 25 лет в музыке, кино и ТВ. Профессиональный студийный звукорежиссёр, саунд-продюсер и эксперт в аудио- и видеопроизводстве.

Сейчас, наверное, только ленивый не слышал ни слова про музыкальные нейросети и вообще про нейросетевые технологии, технологии так называемого искусственного интеллекта. Возможно, даже бабушки в глубинке уже прекрасно обо всём знают, потому что об ИИ говорят повсюду. Но что это такое?

Очень модно называть эти алгоритмы «искусственным интеллектом». Ребята, но как интеллект может быть искусственным? Это же априори некорректно и не совсем логично. Давайте называть нейросети и в целом то, что принято называть ИИ, «умными алгоритмами», так ближе к сути.

Если говорить про музыкальную индустрию, то все эти музыкальные нейросети обучаются на миллионах музыкальных треков, созданных и изданных за долгие годы развития человечества. В этот набор данных входят и классическая музыка, и коммерческий саунд прошлого и настоящего — всё, что создавалось вручную. То есть всё, что было издано, так или иначе, попадает в «датасет».

В процессе обучения нейросеть анализирует огромное количество материала, взаимосвязь множества маленьких кирпичиков, деталей, из которых складывались хиты, узнаваемость и крутость топовых музыкальных произведений человечества.

Однако есть нюанс. Когда человек создаёт новое, что‑то он делает исходя из профессионализма, из опыта, из собственной базы знаний, но в его работе есть и элемент случайности, элемент творчества. Как у поэтов происходит «озарение»? Человек подрывается, берёт лист бумаги и быстро-быстро начинает что‑то писать — буквально с листа. И текст практически готов, требует лишь профессиональной доработки.

То же самое с музыкой: у композитора в голове крутится некий мелодический фрагмент, сырые обрывки, но в какой‑то момент всё складывается в цельную картину. Он бежит к диктофону, напевает, или садится за рояль или гитару и фиксирует идею. Это элемент озарения — бац, и что‑то новое. И даже если в этом новом есть случайные заимствования — не преднамеренные, а именно случайные — автор анализирует их, перерабатывает.

Это отдельная боль опытных композиторов — порой непросто определить, придумал он что‑то сам или случайно скомпилировал чужие идеи, то есть не сплагиатил ли. Но то человек — он анализирует свои действия. Вопрос об авторстве строго регламентирован. Если он действительно что‑то украл, к нему придут, зададут вопросы и устроят разбирательство.

Что происходит с ИИ? Программа генерирует вам песню на основании анализа огромного количества уже готовых треков. Априори генерирует нечто правильное и структурированное, но заведомо чужое.

Если анализировать музыкальный материал, который генерируют нейросети, нём можно встретить много образцов музыкальной неграмотности и различных нестыковок. Музыка — это не только банальные трезвучия и типовые четыре аккорда по кругу, музыка гораздо хитрее. Музыкальная теория — это математика, это сложная, мудрёная, но хорошо просчитанная и продуманная система.

Когда умные алгоритмы на ходу собирают кубики, часто получается музыкально неграмотно — это легко заметить. Бывает, явно слышны фрагменты, склеенные из разных источников, порой замечаешь очевидные музыкальные ошибки. Конечно, алгоритмы стараются это скрыть, завуалировать, пользователю выдаётся сразу готовый вариант. Поймать ИИ за руку сложно, но вся его продукция, так или иначе, является плагиатом.

Это одна из самых важных проблем, которые нейросети создают для медиаиндустрии: кто автор?

Когда вы что‑то сгенерировали, кто является автором произведения — вы или нейросеть? По факту умный алгоритм собирает из того, что создано другими до вас. Но программа не может быть автором! С точки зрения законодательства об авторском и смежных правах, автором может быть только конкретный человек, который что‑то написал и придумал. Здесь же автора нет. Есть программа, генеративный алгоритм, при этом заранее известно, что результат — по сути плагиат.

Сейчас идёт серьёзное обсуждение возможности лицензирования и маркировки такого контента. Крупные интернет-площадки и стриминговые сервисы уже активно борются с потоком сгенерированной музыки и очищают свои каталоги, чтобы защищать честных музыкантов и само творчество. Ведь получается, что человек, не разбирающийся ни в музыке, ни в стихосложении, может просто подобрать ключевые слова, создать запрос и получить готовую песню. Даже вокал можно сгенерировать — достаточно напеть или подгрузить несколько фраз, а алгоритм сымитирует звучание вашего или чужого голоса. Это дополнительный элемент судебных разбирательств, когда создают музыку голосом известного исполнителя.

На самом деле не только у нас, но и в мире нет чёткого законодательства, защищающего голос и облик человека. Вот почему из-за дипфейков, имитации голоса, образа, изменения фонов и прочего возникает множество проблем. Видео-нейросети развиваются очень быстро, появляется огромное количество контента, сложно понять, что настоящее, а что нет. Раньше нейросети делали много ошибок, но технологии развиваются, с каждым днём получается всё точнее и точнее. Алгоритмы усложняются, и все эти имитации становятся всё более достоверными.

Это очень серьёзная проблема и для индустрии, и для людей. Вопросы права и защиты сейчас стоят особенно остро. Как определить автора, как оградить людей от подделок? На мировом уровне предпринимаются разные усилия, но всё пока спорно и непросто.

Любой человек с базовыми техническими знаниями может изучить руководства и научиться генерировать песни. Сейчас появилось огромное количество таких авторов, многие из них не знают ни одной ноты, но генерируют сотни песен в день, выпускают альбомы. Люди, которые много лет учились, которые действительно чувствуют музыку и создают что‑то ценное, оказываются в сложном положении. На фоне столь массово сгенерированного контента выделиться очень трудно, поскольку генерация основана на хитовых, известных материалах.

Настоящие музыканты и творческие люди изначально оказываются в проигрыше, потому что алгоритмы обладают огромными вычислительными мощностями и могут легко их обыграть, как в шахматах, где компьютер уже не оставляет шансов человеку. Противостоять этим алгоритмам по скорости и универсальности практически невозможно.

Программы не только пишут песни, но и делают аранжировки, сведение, обработку — кажется, всё круто и вызывает восторженные отклики от тех, кто не имеет особых навыков. Конечно, в некоторых аспектах это действительно полезно — алгоритмы можно рассматривать как удобные инструменты, как кисти в графическом редакторе. Например, чистка голоса от шумов и звукового мусора сейчас развивается очень хорошо, это действительно крутая тема. Есть ещё потенциал для развития, но в целом эти инструменты помогают сэкономить время.

Если же рассматривать такие программы как самостоятельную замену творческой деятельности, возникает вопрос о праве, авторстве и будущем творческих профессий. Музыканты и другие представители искусства начинают тревожиться за свой хлеб, за своё будущее: многие шли к нему десятилетиями, а теперь алгоритмы отнимают у них само поле деятельности.

Понятно, программы — это хороший инструмент, они будут круто совершенствоваться. Но в конечном счёте решает всё равно человек — тот, кто нажимает на кнопку. Даже если результат получен при помощи генерации, он всё равно связан с внутренним миром и творческим началом пользователя. Поэтому можно сказать, что все эти цифровые «творения» — это в каком‑то смысле тоже творчество, но всё же «псевдо».

Если вы понимаете, что делаете, тогда ИИ-инструменты — это помощник, ваши дополнительные руки, которые экономят время и упрощают рутинные операции. Например, распознавание текста — перевод звукового ряда в текст с последующей автоматической корректировкой, удалением словесного мусора, второстепенных фраз и междометий, чтобы получить чёткий, лаконичный и понятный текст. Эти технологии развиваются прекрасно.

Мне тоже удобнее формулировать мысли вслух, а затем переводить из аудио в текст и корректировать полученное. Поэтому лично для меня технологии распознавания речи очень кстати. Но это совсем не то же самое, что генерация статьи по запросу.

Добро или Зло?

У множества людей, связанных с музыкой и творчеством, есть потенциальный риск потери доходов за счёт того, что музыка может генерироваться буквально за секунды, любой человек в любой день может создать огромное количество новых песен и музыки. Если не фильтровать, не вводить ограничения и не ставить маркеры, а просто загружать на музыкальные платформы — постепенно всё заполнит ИИ-контент и на его фоне настоящая музыка, созданная людьми для людей, просто потеряется. Что мы и наблюдаем!

Стриминговые площадки и интернет в целом переполнены шаблонным, копированным, клонированным контентом. Если учесть, что генеративные алгоритмы и нейросети обучаются на данных, в которых всё больше доля уже сгенерированного материала, выходит, что они начинают обучаться сами на себе. Возникает замкнутый круг, ведущий к деградации: шаблонность усиливается, а музыка становится неживой.

Не секрет, что запасы хитовых мелодических и гармонических форм давно исчерпаны — многое уже было использовано тысячи раз. Но когда музыкант сочиняет сам, он может ошибиться, импровизировать, находить неожиданные ходы. Нейросети же научены делать всё «правильно». Их обучают создавать качественный, но повторяющийся продукт. В итоге получается материал гладкий, предсказуемый — звук, который растворяется среди множества себе подобных.

Слушатели начинают подсознательно чувствовать, что что‑то не так — сгенерированная музыка кажется им ненастоящей. Она всегда похожа на что‑то знакомое, всегда что‑то напоминает, и постепенно это начинает надоедать.

Давайте отделять настоящий креатив и творчество от ремесла и шаблонности. Музыкант в студии может просто играть мелодию по нотам, а может привнести креатив — изменить что‑то, добавить, импровизировать. Это разные подходы. То же касается вокалистов и других творческих специалистов. Там, где важны эмоции, боль, радость, восторг — яркость и выразительность — человеческий фактор остаётся решающим.

Однако существует множество задач, где яркость и уникальность не нужны, а требуется простота и узнаваемость. Вот здесь генеративные нейросети становятся отличным инструментом. Например, для фоновой музыки, звукового оформления документальных фильмов, подкастов, кафе, ресторанов и баров, где музыка звучит фоном, а не является центральным элементом. Для таких целей сгенерированная музыка очень подходит: её можно использовать без дополнительных договоров и платежей. Фоновая ИИ-музыка абсолютно оправданна, в том числе экономически — это просто великолепно. Это действительно очень круто. Я обеими руками за, аплодирую стоя.

Если же музыку генерируют люди, которые ничего в этом не понимают, просто чтобы быстро что‑то наклепать — это убивает творчество, убивает весь творческий посыл. Выбор очень простой: либо вы занимаетесь творчеством, либо ремесленничеством. Каждый решает сам за себя.

2025-12-19 10:00